SKRIPSI ANALISIS PENJUALAN BARANG LARIS DAN KURANG LARIS TERHADAP PERCETAKAN AWFA DIGITAL PRINTING MENGGUNAKAN METODE DECISION TREE DENGAN OPTIMASI

(1)

SKRIPSI

ANALISIS PENJUALAN BARANG LARIS DAN KURANG LARIS

TERHADAP PERCETAKAN AWFA DIGITAL PRINTING

MENGGUNAKAN METODE DECISION TREE DENGAN OPTIMASI

ALGORITMA GENETIKA

Diajukan untuk memenuhi salah satu syarat memperoleh gelar Sarjana Komputer

Disusun Oleh:

Nama : Irham Muzaky

Nim : 311510096

PROGRAM STUDI TEKNIK INFORMATIKA

FAKULTAS TEKNIK

UNIVERSITAS PELITA BANGSA

KABUPATEN BEKASI

(2)

HALAMAN PERSETUJUAN

Nama : Irham Muzaky

NIM : 311510096

Fakultas Teknik : Teknik Informatika

Judul Tugas Akhir : Analisis Penjualan Barang Laris Dan Kurang Laris Terhadap Percetakan Awfa Digital Printing Menggunakan Metode Decision Tree dengan Optimasi Algoritma Genetika.

Tugas Akhir ini telah diperiksa dan disetujui, Kabupaten Bekasi, 02 November 2019

Menyetujui :

Dosen Pembimbing I Dosen Pembimbing II

Suherman, M.Kom Adi Rusdi Widya, S.T, M.T

NIDN : 0308086805

NIDN : 0415096901

Mengertahui :

Ka. Prodi Teknik Informatika Dekan Fakultas Teknik Universitas Pelita Bangsa

Aswan S. Sunge, SE., M.Kom Putri Anggun Sari, S.Pt., M.Kom

(3)

(4)

(5)

PERNYATAAN KEASLIAN SKRIPSI

Sebagai mahasiswa Universitas Pelita Bangsa, yang bertanda tangan dibawah ini, saya :

Nama : Irham Muzaky NIM : 311510096

Menyatakan bahwa karya ilmiah saya yang berjudul :

Analisis Penjualan Barang Laris Dan Kurang Laris Terhadap Percetakan Awfa Digitl Printing Menggunakan Metode Decision Tree Dengan Optimasi

Algoritma Genetika.

Merupakan karya asli saya (kecuali cuplikan dan ringkasan yang masing-masing

telahsaya jelaskan sumbernya dan perangkat pendukung seperti laptop dll). Apabila

dikemudian hari, karya saya di sinyalir bukan karya asli saya, yang disertai dengan

bukti-bukti yang cukup, maka saya bersedia untuk dibatalkan gelar saya beserta hak

dan keawajiban yang melekat pada gelar tersebut. Demikian Surat pernyataan ini

sayabuat dengan sebenarnya.

Dibuat di : Bekasi Tanggal 05 November 2019 Yang menyatakan

(6)

PERNYATAAN PERSETUJUAN PUBLIKASI KARYA ILMIAH

UNTUK KEPENTINGAN AKADEMIS

Sebagai mahasiswa Universitas Pelita Bangsa, yang bertanda tangan dibawah ini, saya

Nama : Irham Muzaky

NIM : 311510096

Demi mengembangkan ilmu pengetahuan, menyetujui untuk memberikan kepada Universitas Pelita Bangsa Hak Bebas Royalti Non-Eksklusif (Non-Exsclusive Royalti Free Right) atas karya ilmiah saya yang berjudul :

Analisis Penjualan Barang Laris Dan Kurang Laris Terhadap Percetakan Awfa Digitl Printing Menggunakan Metode Decision Tree Dengan Optimasi

Algoritma Genetika.

Beserta perangkat yang diperlukan (bila ada). Dengan Hak Bebas Royalti NonEksklusif ini, Universitas Pelita Bangsa berhak untuk menyimpan data, mengcopy ulang, mempergunakan dan mengelola dalam bentuk database, serta mendistribusikandan menampilkan/mempublikasikan karya ilmiah ini di internet atau media lain untuk kepentingan akademis tanpa ijin dari saya selama tetap mencantumkan saya sebagaipenulis dan pemilik hak cipta. Segala bentuk tuntuan hukum yang timbul ataspelanggaran Hak Cipta karya ilmiah ini menajdu tanggung jawab saya pribadi :

Dibuat di : Bekasi

Tanggal : 05 November 2019 Yang menyatakan

(7)

UCAPAN TERIMAKASIH

Segala puji dan syukur penulis panjatkan kepada Tuhan Yang Maha Esa yang

telah melimpahkan kasih dan karunia-Nya sehingga penulis dapat menyelesaikan

penulisan Skripsi ini dengan tepat waktu. Penulisan Laporan Tugas Akhir dengan judul “ANALISIS PENJUALAN BARANG LARIS DAN KURANG LARIS

TERHADAP PERCETAKAN AWFA DIGITL PRINTING MENGGUNAKAN

METODE DECISION TREE DENGAN OPTIMASI ALGORITMA

GENETIKA”, adapunmaksud dari penulisan Skripsi ini untuk memenuhi salah satu

syarat kelulusanFakultas Teknik Jenjang Pendidikan Strata-1 di Universitas Pelita

Bangsa.

Penulis menyadari bahwa penulisan Skripsi ini tidak terlepas dari bimbingan,

bantuan dan dukungan dari berbagai pihak. Untuk itu, pada kesempatan yang

berbahagia ini, penulis mengucapkan terima kasih kepada:

1. Ibu Putri Anggun Sari, SPt., M. Si, Selaku Dekan Fakultas Teknik Universitas Pelita Bangsa.

2. Bapak Aswan S, Sunge. S.E, M.Kom. selaku Ketua Program Studi Teknik Informatika Universitas Pelita Bangsa Cikarang

3. Bapak Suherman, M.Kom. selaku Dosen Pembimbing I Skripsi yang telah banyak memberikan saran dan bimbingan dalam proses penulisan Skripsi ini.

4. Bapak Adi Rusdi Widya, S.T., M.T. Selaku Dosen Pembimbing II Skripsi yang telah banyak memberikan saran dan bimbingan dalam proses penulisan Skripsi ini.

(8)

5. Seluruh Dosen Teknik Informatika Universitas Pelita Bangsa

6. Orang tua dan keluarga besar yang selalu memberikan do’a, dukungan dan semangat yang tinggi untuk dapat menyelesaikan penulisan Skripsiini. 7. Teman-teman yang selalu memberikan dorongan dan selalu memberikan

motivasi bagi penulis yang menyelesaikan penulisan Skripsi ini.

8. Seluruh pihak yang belum disebutkan diatas, karena begitu banyak nya bantuan, kesabaran, dan gagasan-gagasan yang diberikan kepada penulis, sehingga penulis Skripsi ini lebih berjalan dengan mudah dan lancar.

Penulis juga menyadari bahwa penulisan Skripsi ini masih terdapat banyak kelemahan dan kekurangannya. Maka dari itu, penulis akan dengan senang hati menerima segala saran dan kritik yang ditunjukan untuk menyempurnakan adanya Skripsi ini. Akhir kata, semoga penulisan Skripsi ini bermanfaat bagi rekan-rekan dansemua pihak yang membutuhkan.

Bekasi, 05 November 2019

(9)

ABSTRAK

Data mining adalah proses dimana data dapat dicari dengan pola atau informasi menarik dengan data terpilih digunakan metode-metode tertentu. Masalah yang ditemukan pada penjualan barang yang laris dan kurang laris diperlukannya sebuah metode untuk mengklasifikasi penjualan barang apa saja yang paling laris dan kurang laris. Algoritma C4.5 adalah algoritma yang digunakan untuk membangun decision tree (pengambilan keputusan). Algoritma C.45 salah satu algoritma induksi pohon keputusan. Tujuannya mengoptimasi Algoritma C4.5 Decision Tree dengan Algoritma Genetika. Penggunaan metode Algoritma C4.5 Decision Tree menghasilkan 85,15%, sedangkan hasil setelah dioptimasi menggunakan Algoritma Genetika mencapai 93,09%. demikian hasil optimasi Algoritma C4.5 Decision Tree + Algoritma Genetika dapat meningkatkan nilai akurasi sehingga menghasilkan akurasi yang lebih optimal. Dapat disimpulkan bahwa hasil klasifikasi prediksi penjualan barang laris mencapai 37 setelah di optimasi menjadi 121, sedangkan hasil prediksi kurang laris mencapai 133 setelah di optimasi menjadi 524.

Kata kunci : Algoritma C4.5 Decision Tree, Algoritma Genetika, Analisis, Optimasi.

(10)

ABSTRACT

Data mining is the process by which data can be searched for with interesting patterns or information with selected data used by certain methods. Problems found in selling items that are in demand and not selling are needed A method for classifying what is the best-selling and least-selling item is needed. C4.5 algorithm is an algorithm used to build a decision tree (decision preparation). C.45 algorithm is one of the decision tree induction algorithms. The goal is to optimize the C4.5 Decision Tree Algorithm with Genetic Algorithms. The use of the C4.5 Decision Tree Algorithm method yields 85.15%, while the results after being optimized using the Genetic Algorithm reach 93.09%. Thus the results of optimization of the C4.5 Algorithm Decision Tree + Genetic Algorithm can increase the accuracy value resulting in more optimal accuracy. It can be denied from the result of the predicted sales of goods reaching 37 after being optimized to 121, when the prediction results are less than 133 after being optimized to 524.

Keywords : C4.5 Decision Tree Algorithm, Genetic Algorithm, Optimization, Analysis.

(11)

DAFTAR ISI

HALAMAN PERSETUJUAN ... i

HALAMAN PENGESAHAN ... ii

PERNYATAAN KEASLIAN SKRIPSI ... iii

PERNYATAAN PERSETUJUAN PUBLIKASI ... iv

UCAPAN TERIMAKASIH ... v

ABSTRAK ... vi

ABSTRACT ... vii

DAFTAR ISI ... ix

DAFTAR TABEL ... xii

DAFTAR GAMBAR ... xiii

BAB I PENDAHULUAN ... 1

1.1. Latar Belakang... 1

1.2. Identifikasi Masalah ... 2

1.3. Rumusan Masalah ... 3

1.4. Batasan Masalah ... 3

1.5. Tujuan dan Manfaat ... 4

1.5.1. Tujuan ... 4

(12)

1.6. Metode Pengumpulan Data ... 5 1.7. Sistematika Penulisan ... 6 BAB II ... 7 2.1. Penelitian Terkait ... 8 2.2. Landasan Teori ... 10 2.2.1. Algoritma ... 10

2.2.2. Tahapan Algoritma C4.5 Decision Tree ... 11

2.2.3. Data Mining... 12

1. Pengertitan Data Mining ... 12

2. Fungsi Data Mining ... 13

3. Kategori Dalam Data Mining ... 14

4. Teknik Dalam Data Minig ... 15

5. Proses Tahapan Data Mining ... 16

6. Penerapan Data Mining... 19

2.2.4. Pengertian Decision Tree ... 21

2.2.5. Pengertian Pembentukan Pohon Keputusan Algoritma C4.5 ... 23

2.2.6. Keuntungan Dan Kekurangan Algoritma C4.5 Decision Tree ... 24

2.2.7. Pengertian Optimasi... 25

2.2.8. Pengertian Algoritma Genetika ... 25

2.3. Definisi Data... 27

2.4. Definisi Percetakan ... 27

2.5. Definisi Bagian Percetakan ... 28

(13)

BAB III METODE PENELITIAN ... 32

3.1. Objek Penelitian ... 32

3.1.2. Sejarah Perusahaan ... 32

3.2.2. Struktur Organisasi Perusahaan ... 33

3.3.2. Sistem yang Berjalan ... 34

3.2. Metode Penelitian ... 35

3.3. Metode Pengumpulan Data ... 38

3.4. Pengolahan Data Awal ... 39

3.5. Pengelolaan Data Awal ... 40

3.6. Metode Yang Diusulkan ... 45

BAB IV HASIL DAN PEMBAHASAN ... 47

4.1. Hasil Pengujian ... 43

4.1.1. Pengujian Decision Tree ... 47

4.1.2. Pengujian Decision Tree dan Algoritma Genetika ... 54

4.2. Pembahasan Hasil Pengujian... 57

BAB V PENUTUP ... 60

5.1. Kesimpulan... 60

5.2. Saran ... 61

DAFTAR PUSTAKA ...

(14)

DAFTAR TABEL

Tabel 3.1. Dataset Penjualan ... 39

Tabel 3.2. Data Awal ... 39

Tabel 3.3. Atribut yang Digunakan ... 40

Tabel 3.4. Menentukan Barang Laris Dan Kurang Laris. ... 41

Tabel 3.5. Pengujian Data ... 41

Tabel 3.6. Model Confusion Matrix ... 44

Tabel 4.1. Data yang Digunakan ... 47

(15)

DAFTAR GAMBAR

Gambar 2.1. Tahapan Knowladge Discovery in Database (KDD) ... 17

Gambar 2.2. Model Pohon Keputusan ... 23

Gambar 2.3. Kerangka Berfikir ... 31

Gambar 3.1. Struktur Organisasi Percetakan Awfa Digital Printing ... 33

Gambar 3.2 Sistem yang Berjalan ... 34

Gambar 3.3 Tahapan Penelitian... 36

Gambar 3.4 Ilustrasi Split Validation ... 42

Gambar 3.5. Metode yang Diusulkan ... 46

Gambar 4.1. Import Dataset. ... 48

Gambar 4.2. Tampilan Operator yang Digunakan... 49

Gambar 4.3. Split Validation. ... 50

Gambar 4.4. Decision Tree (Pohon Keputusan) ... 51

Gambar 4.5. Hasil Accuracy Decision Tree ... 53

Gambar 4.6. Model Decision Tree + Algoritma Genetika ... 54

Gambar 4.7. Konfigurasi Operator Generate ... 55

Gambar 4.8. Hasil Accuracy Decision Tree + Algoritma Genetika ... 56

Gambar 4.9. Performance Vector ... 56

Gambar 4.10. Grafik Hasil Pengujian Pred. Laris ... 57

(16)

BAB I

PENDAHULUAN

1.1. Latar Belakang

Perkembangan teknologi informasi telah banyak memberikan kontribusi

pada cepatnya pertumbuhan, data yang terkumpul dan disimpan pada jumlah yang

besar. Untuk mendapatkan data yang valid dibutuhkan sebuah metode agar data

yang diolah menjadi informasi berharga dan menjadi informasi yang bermanfaat

untuk mendukung diambilnya sebuah keputusan dalam keperluan pribadi, bisnis,

sains dan teknologi. Suatu teknologi yang bisa mewujudkannya adalah dengan

menggunakan atau memanfaatkan Data mining. Data mining adalah proses dimana

data dapat dicari dengan pola atau informasi menarik dengan data terpilih

digunakan metode-metode tertentu. Salah satu metode yang dipakai ialah metode

Decision tree dan Algoritma Genetika. Dalam usaha penjualan khususnya dibidang

percetakan pastinya mempunyai data-data penjualan yang begitu banyak sehingga

agar dapat memantau data penjualan diperlukannya sebuah metode untuk

mengklasifikasi penjualan barang apa saja yang paling digemari pelanggan dan

yang sedikit digemari. Metodologi yang digunakan dalam mengklasifikasi

penjualan barang ini menggunakan Decision Tree dengan mengoptimasi

menggunakan Algoritma Genetika untuk mengetahui apa saja yang paling sering

dibeli oleh konsumen.

Dengan adanya data mining diharapkan mampu untuk mengolah data-data

(17)

data atau informasi yang dibutuhkan dengan demikian bisa menggali informasi

yang berguna mampu mengambil kesimpulan dari permasalahan yang ada pada

masalah penggalian data menjadi sebuah informasi guna dapat membantu atau

mempermudah barang apa saja yang paling sering di beli oleh konsumen.

Proses transaksi penjualan pada percetakan ini memiliki banyak data-data

transaksi yang begitu banyak sehingga menyulitkan untuk mendapatkan informasi

data barang apa saja yang paling laku dan barang apa saja yang kurang diminati.

Tujuan penelitian ini ialah untuk menerapkan teknik data mining dengan

menggunaka metode Decision tree algoritma C4.5 dan Optimasi dengan

menggunakan Algoritma Genetika kasus di percetakan dan diharapkan mampu

memberikan informasi berupa klasifikasi penjualan barang apa saja yang paling

sering diminati oleh konsumen dan barang yang kurang diminati. Sehingga

kedepannya pemilik bisnis ini dapat melakukan analisa barang apa saja yang paling

laku dipasaran.

1.2. Identifikasi Masalah

Dari latar belakang yang telah ditulis, penulis memberikan identifikasi

masalah yang akan dijadikan bahan penelitian sebagai berikut yaitu :

1) Kurang optimalnya hasil informasi yang dihasilkan dari Algoritma C4.5 itu

sendiri. Dan belum adanya suatu tambahan fitur optimasi dalam pengolahan

data agar hasil akurasi yang didapat lebih optimal.

2) Kurangnya informasi dari data penjualan barang laris dan kurang laris di

(18)

1.3. Rumusan Masalah

Berdasarkan identifikasi masalah yang telah dipaparkan, maka rumusan

sebagai berikut :

1) Bagaimana mengoptimasi menggunakan metode Descision Tree dengan

Algoritma Genetika sehingga dapa menghasilkan akurasi yang lebih optimal

dalam pengklasifikasian penjualan barang yang laris dan kurang laris?

1.4. Batasan Masalah

Agar masalah yang dibahas tidak menyimpang dari tujuan, maka perlu

dibuat batasan masalah, yaitu :

1) Metode yang digunakan adalah Decision Tree untuk menentukan penjualan

barang yang laris dan kurang laris dengan optimasi algoritma genetika.

2) Data yang digunakan untuk menganalisa adalah data dari percetakan Awfa

Digital Printing.

3) Data yang diambil bersumber dari percetakan Awfa Digital Printing.

(19)

1.5. Tujuan dan Manfaat 1.5.1. Tujuan

Sesuai dengan rumusan masalah yang telah diutarakan, maka tujuan

dibuatnya penelitian ini adalah :

1) Digunakannya data mining untuk mengklasifikasi penjualan barang agar

data – data yang jumlahnya banyak dapat diolah menjadi informasi yang

bermanfaat. Dengan menggunakan algoritma C4.5.

2) Meningkatkan efektifitas dan produktifitas dalam mengklasifikasi atau

mencari barang (produk) apa saja yang paling diminati, atau yang kurang

diminati.

3) Mempermudah dan memperlancar cara kerja pegawai dalam pengolahan

data – data penjualan yang lebih efektif dan efisien, sehingga

menghasilkan pengolahan data yang lebih baik dari sebelumnya yang

sedang berjalan saat ini.

1.5.2. Manfaat

Manfaat dari penelitian ini adalah untuk mempermudah dalam mengambil

kepustusan dan mengetahui informasi pembelian produk yang sering dibeli oleh

konsumen dan yang kurang diminati konsumen.

Mempermudah dan memperlancar dalam pengolahan data penjualan yang

lebih efektif dan lebih efisien, sehingga menghasilkan pengolahan data yang lebih

(20)

1) Manfaat bagi penulis

Penulis dapat menambah pengetahuan dan pemahaman dalam bidang

kajian data mining khususnya algoritma C4.5. Dan penelitian ini dapat

dijadikan sarana untuk ilmu pengetahuan dan keterampilan yang sudah

di dapatkan selama masa perkuliahan.

2) Manfaat bagi akademik

Dapat menambah literasi ilmiah di perpustakaan serta dapat dijadikan

sebagai acuan ilmu pengetahuan bagi mahasiswa yang sedang

mengembangkan dan mengkaji data mining khusunya menggunakan

algoritma C4.5.

3) Bagi pembaca

Sebagai bahan referensi, masukan, dan tambahan ilmu pengetahuan

khususnya mengenai data mining menggunakan algoritma C4.5 yang

nantinya dapat dikembangkan lagi lebih jauh dari yang sebelumnya.

1.6. Metode Pengumpulan Data

Berikut ini adalah metode pengumpulan data yang diterapkan penulis dalam

melakukan penelitian :

1) Studi Pustaka

Penulis mempelajari materi terkait dan menyusun penelitian ini

(21)

2) Sumber Data

Penulis memperoleh data penelitian ini, data yang digunakan

bersumber dari karyawan atau pengurus percetakan Awfa Digital

Printing.

1.7. Sistematika Penulisan

Skripsi ini tersusun dalam lima bagian, yaitu pendahuluan, landasan teori

atau tinjauan pustaka, metode penelitian, hasil dan pembahasan, serta penutup.

Dimana masing – masing penelitian tersebut menghasilkan pembahasan secara

sistematis.

BAB I : PENDAHULUAN

Pada isi bab pertama, pendahuluan membahas tentang latar belakang

penelitian, identifikasi dan batasan masalah, rumusan masalah, maksud dan tujuan

penelitian, manfaat penelitian, metode pengumpulan data dan sistematika

penulisan.

BAB II : TINJAUAN PUSTAKA

Bab dua, landasan teori terbagi ke dalam beberapa sub bab yang didalamnya

mendeskripsikan teori – teori yang didapat dari sumber – sumber yang relevan

untuk dijadikan panduan dalam penyusunan skripsi.

BAB III : METODE PENELITIAN

Bab tiga berisi tentang penjelasan tahap penelitian, objek penelitian, data

(22)

BAB IV : HASIL DAN PEMBAHASAN

Bab keempat, penulis menerapkan metode data mining pada data yang telah

diperoleh serta pembahasan dari penelitian yang dilakukan.

BAB V : PENUTUP

Bab ini merupakan bab terakhir yang terdiri dari dua sub bab yakni,

kesimpulan dan saran. Bab ini juga memuat hasil kesimpulan dari penelitian beserta

(23)

BAB II

TINJAUAN PUSTAKA

2.1. Penelitian Terkait

Adapun penelitian terkait dengan yang berhubungan dengan skripsi ini yaitu :

Penelitian pertama [2] dalam jurnalnya yang berjudul “Analisa Algoritma

C4.5 Untuk Memprediksi Penjualan Motor Pada Pt. Capella Dinamik Nusantara Cabang Muka Kuning”. Pada penelitian ini, peneliti menggunakan algoritma C4.5

untuk melihat pola prediksi perilaku konsumen membeli motor. Jumlah data yang

sangat banyak sangat sulit untuk dianalisa, analisa digunakan untuk melihat pola

dari data penjualan sehingga dapat menghasilkan prediksi penjualan motor yang

kedepannya berguna untuk pendistribusian sepeda motor dibeberapa wilayah.

Algoritma C4.5 dianggap sebagai algoritma yang mampu membantu dalam

melakukan klasifikasi data yang banyak karena karakteristik dalam bentuk data

yang diklasifikasi dapat diperoleh dengan jelas dan tepat, baik dalam bentuk

struktur pohon keputusan (Decision tree) maupun aturan if-then, sehingga dapat

memudahkan pengguna dalam melakukan penggalian informasi terhadap data yang

bersangkutan. Pada pemilihan atribut juga sangat mempengaruhi dalam pengolahan

Algoritma C4.5 karena keputusan sangat bergantung pada atribut yang dipilih.

Penelitian kedua [3] dengan judul penelitiannya “Metode Decision Tree

Algoritma C.45 Dalam Mengklasifikasi Data Penjualan Bisnis Gerai Makanan

(24)

memprediksi untuk menentukan menu makanan yang terjual dengan status

penjualan yang laris dan kurang laris berdasarkan dari menu makanan yang ada.

Dan penelitian ini menggunakan Algoritma C4.5 untuk membuktihan hasil

penelitian dalam mencari menu makanan apa saja yang kurang laris, laris dan sangat

laris pada bisnis gerai makan cepat saji XYZ, menghitung entropy, untuk semua

kasus, menghitung entropy untuk sub kasus (berdasarkan atribut) dan menghitung

gain. Dan hasil yang didapat dari Algoritma C4.5 dihasilkan nilai entropy dan gain

tertinggi ialah 1,501991 terdapat di atribut-atribut menu makanan dalam

menghitung dengan cara manual. Sedangkan hasil yang menggunakan Rapidminer

ialah dari jumlah yang terjual menu makanan (Rice bento = kurang laris, dada =

laris) dengan bobot (weight) masing-masing atribut : Harga (0,738), Jenis Menu

(0,067), Jumlah Terjual (0,156), Status Penjualan (0,040).

Penelitian ketiga [1] penelitian ini yang berjudul “Menentukan

Kemungkinan Masuknya Calon Mahasiswa Baru Pada Sebuah Perguruan Tinggi

Swasta Manggunakan Teknik Klasifikasi Pohon Keputusan Dengan Aplikasi Rapidminer 5.1”. Metode klasifikasi yang digunakan untuk mengambil sebuah

keputusan untuk memperkirakan suatu kasus yaitu data mahasiswa yang lulus dan

gagal, dengan data calon mahasiswa mendaftar membandingkan dengan data

mahasiswa yang sudah di terima menjadi mahasiswa. Dipenelitian ini

menggunakan Rapidminer untuk dilakukan data Cleaning yaitu berupa

penghapusan data yang terduplikasi dan inkonsistensi. Adapun data yang akan diuji

variabel input yang digunakan antara lain gelombang, pekerjaan orangtua, asal

(25)

dari hasil data cleaning ini tersisa data sebanyak 513 orang untuk data tahun 2009,

730 orang untuk data tahun 2010, dan .sebanyak 730 orang untuk data tahun 2011.

Pengujian dengan menggunakan rapidminer menghasilkan data yang telah diolah

ialah 2011 sebanyak 744 orang, 905 orang, dan 883 orang. Dari data yang sudah

didapat ternyata masih banyak terdapat duplikasi data, inkonsistensi data berupa

field yang kosong dan kesalahan cetak (tipografi).

2.2. Landasan Teori

Di dalam landasan teori, penulis menyertakan referensi jurnal dan buku

untuk mendukung teori dalam penelitian ini.

2.2.1. Algoritma

Algoritma C4.5. merupakan kelompok algoritma pohon keputusan (decision

tree). Algoritma ini mempunyai input berupa training samples dan samples.

Training samples berupa data contoh yang akan digunakan untuk membangun

sebuah tree yang telah diuji kebenaranya. Sedangkan samples merupakan field-field

data yang nantinya akan kita gunakan sebagai parameter dalam melakukan

klasifikasi data [3].

Algoritma C4.5 adalah algoritma yang digunakan untuk membangun

decision tree (pengambilan keputusan). Algoritma C.45 salah satu algoritma

induksi pohon keputusan yaitu ID3 (Iterative Dichotomiser 3). ID3 dikembangkan

oleh J. Ross Quinlan. Dalam prosedur algoritma ID3, input berupa sampel training,

label training dan atribut. Algoritma C4.5 merupakan pengembangan dari ID3.

(26)

adalah sebagai antara lain bisa mengatasi missing value, bisa mengatasi

continu data, dan pruning [6]

2.2.2. Tahapan Algoritma C4.5 Decision Tree

[12] Algoritma decision tree digunakan untuk membangun sebuah pohon

keputusan yang mudah dimengerti, fleksibel, dan menarik karena dapat

divisualisasikan dalam bentuk gambar. Pohon keputusan adalah salah satu metode

klasifikasi yang paling populer karena mudah untuk diinterpretasi oleh manusia.

Pohon keputusan adalah model prediksi menggunakan struktur pohon atau struktur

berhirarki. Konsep dari pohon keputusan adalah mengubah data menjadi pohon

keputusan dan aturan-aturan keputusan.

Ada beberapa tahap dalam membuat sebuah pohon keputusan dengan

algoritma C4.5 yaitu:

a) Mempersiapkan data training, dapat diambil dari data histori yang

pernah terjadi sebelumnya dan sudah dikelompokan dalam kelas-kelas

tertentu.

b) Menentukan akar dari pohon dengan menghitung nilai gain yang

tertinggi dari masing-masing atribut atau berdasarkan nilai index

entropy terendah. Sebelumnya dihitung terlebih dahulu nilai index

(27)

c) Hitung nilai gain dengan rumus:

d) Untuk menghitung gain ratio perlu diketahui suatu term baru yang

disebut Split Information dengan rumus:

e) Selanjutnya menghitung gain ratio

f) Ulangi langkah ke-2 hingga semua record terpartisi Proses partisi

pohon keputusan akan berhenti disaat:

1) Semua tupel dalam record dalam simpul m mendapat kelas yang sama

2) Tidak ada atribut dalam record yang dipartisi lagi

3) Tidak ada record didalam cabang yang kosong.

2.2.3. Data Mining

1. Pengertian Data Mining

Data mining mengacu pada proses pencarian informasi yang belum

diketahui sebelumnya dari rangkaian sekumpulan data yang besar [2].

Pada prosesnya data mining akan mengekstrak informasi yang akan

diolah dengan cara menganalisis adanya pola-pola ataupun hubungan

(28)

Definisi lain data mining adalah serangkaian proses yang

memperkerjakan satu atau lebih teknik pengolahan komputer untuk

menganalisis dan mengekstrak data secara otomatis atau serangkaian proses

untuk menggali nilai tambah dari suatu kumpulan data yang selama ini tidak

diketahui secara manual [2].

Data mining, sering juga disebut sebagai knowledge discovery in

database (KDD) adalah kegiatan yang meliputi pengumpulan, pemakaian data,

historis untuk menemukan keteraturan, pola atau hubungan dalam set data

berukuran besar [14].

2. Fungsi Data Mining

Fungsi-fungsi yang diterapkannya dalam data mining [17] :

1) Assosiation, adalah proses untuk menemukan aturan asosiasi antara

suatu kombinasi item dalam suatu waktu.

2) Sequence, proses untuk menemukan aturan asosiasi antara suatu

kombinasi item dalam suatu waktu dan diterapkan lebih dari satu

periode.

3) Clustering, adalah proses pengelompokan sejumlah data/obyek ke

dalam kelompok data sehingga setiap kelompok berisi data yang

mirip.

4) Classification, proses penemuan model atau fungsi yang

(29)

tujuan untuk dapat memperkirakan kelas dari suatu objek yang

labelnya tidak diketahui.

5) Regression, adalah proses pemetaan data dalam suatu prediksi.

6) Forecasting, adalah proses pengestimasian nilai prediksi berdasarkan

pola - pola di dalam sekumpulan data.

7) Solution, adalah proses penemuan akar masalah dan problem solving

dari persoalan bisnis yang di hadapi atau paling tidak sebagai

informasi dalam pengambilan keputusan.

3. Kategori dalam Data Mining

Berikut kategori dalam data mining [17] :

1) Prediktif Tujuan dari tugas prediktif adalah untuk memprediksi nilai

dan atributtertentu berdasarkan pada nilai atribut – atribut lain. Atribut

yang 10 diprediksi umumnya dikenal sebagai target atau variabel tak

bebas, sedangkan atribut – atribut yang digunakan untuk membuat

prediksidikenal sebagai explanatory atau variabel bebas.

2) DeskriptifTujuan dari deskriptif adalah untuk menurunkan pola – pola

(korelasi, trend, cluster, teritori, dan anomaly) yang meringkas

hubungan yangpokok dalam data. Tugas data mining deskriptif sering

merupakan penyelidikan dan seringkali memerlukan teknik post –

(30)

4. Teknik dalam Data Mining

Teknik yang digunakan dalam data mining erat kaitanya dengan “penemuan” (discovery) dan “pembelajaran” (learning) yang terbagi dalam

tiga metode utama pembelajaran yaitu [17]

1) Supervised Learning adalah teknik yang paling banyak digunakan.

Teknik ini sama dengan “programing by example”. Teknik ini

melibatkan fase pelatihan dimana data pelatihan historis yang karakter – karakternya dipetakan ke hasil – hasil yang telah diketahui diolah

dalam algoritma data mining. Proses ini melatih algoritma untuk

mengenali variabel – variabel dan nilai – nilai kunci yang nantinya akan

digunakan sebagai dasar dalam perkiraan – perkiraan ketika di berikan

data baru.

2) Unsupervised Learning

Teknik pembelajaran ini tidak melibatkan fase pelatihan seperti yang

terdapat pada supervised learning. Teknik ini bergantung pada

penggunaan algoritma yang mendeteksi semua pola, seperti

associations dan sequences, yang muncul dari kriteria penting yang

spesifik dalam data masukan. Pendekatan ini mengarah pada

pembuatan banyak aturan (rules) yang mengkarakterisasikan penemuan

associations, clusters, dan segments. Aturan – aturan ini kemudian

(31)

3) Reinforcement Learning

Teknik pembelajaran ini jarang digunakan dibandingkan dengan dua

teknik lainya, namun memiliki peranan – peranan yang terus

dioptimalkan dari waktu ke waktu memiliki control adaptif. Teknik ini sangat menyerupai kehidupan nyata yaitu seperti “on – job training”,

dimana seorang pekerja diberikan sekumpulan tugas yang

membutuhkan keputusan – keputusan. Pada beberapa titik waktu kelak

diberikan penilaian atas performace pekerja tersebut kemudian pekerja

diminta mengevaluasi keputusan – keputusan yang telah dibuatnya

sehubungan dengan hasil performace pekerja tersebut. Reinformace

learning sangat tepat digunakan untuk menyelesaikan masalah –

masalah yang sulit bergantung pada waktu.

5. Proses Tahapan Data Mining

Menurut [17] data mining merupakan salah satu dari rangkaian

Knowledge Discovery Database (KDD). KDD berhubungan dengan teknik

integrasi dan penemuan proses tersebut memiliki tahap sebagai berikut.

1) Pembersihan data (untuk membuang data yang tidak konsisten dan

noise).

2) Integrase data (penggabungan data dari beberapa sumber).

3) Transformasi data (data diubah menjadi bentuk yang sesuai untuk di

mining). Aplikasi teknik data mining, proses ekstrasi pola dari data yang

(32)

4) Evaluasi pola yang ditemukan (proses interprestasi pola menjadi

pengetahuan yang dapat digunakan untuk mendukung pengambilan

keputusan).

5) Presentasi pengetahuan (dengan teknik visualisasi).

Gambar 2.1 Tahapan Knowledge Discovery in Database (KDD)

Tahap ini merupakan bagian dari proses pencarian pengetahuan yang

mencakup pemeriksaan apakah pola atau informasi yang ditemukan

bertentangan dengan fakta atau hipotesa yang ada sebelumnya. Langkah

terakhir KDD adalah mempresentasikan pengetahuan dalam bentuk yang

mudah dipahami pengguna.

1. Data selection

Pemilihan (seleksi) data dari sekumpulan data operasional perlu

(33)

hasil seleksi yang digunakan untuk proses data mining, disimpan dalam suatu

berkas, terpisah dari basis data operasional.

2. Pre-processing / cleaning

Sebelum proses data mining dapat dilaksanakan, perlu dilakukan proses

cleaning pada data yang menjadi fokus KDD. Proses cleaning mencakup

antara lain membuang duplikasi data, memeriksa data yang inkonsisten, dan

memperbaiki kesalahan pada data.

3. Transformation

Coding adalah proses transformasi pada data yang telah dipilih,

sehingga data tersebut sesuai untuk proses data mining. Proses coding dalam

KDD merupakan proses kreatif dan sangat tergantung pada jenis atau pola

informasi yang akan dicari dalam basis data.

4. Data mining

Data mining adalah proses mencari pola atau informasi menarik dalam

data terpilih dengan menggunakan teknik atau metode tertentu. Teknik,

metode, atau algoritma dalam data mining sangat bervariasi. Pemilihan

metode atau algoritma yang tepat sangat bergantung pada tujuan dan proses

KDD secara keseluruhan.

5. Interpretation / evalution

Pola informasi yang dihasilkan dari proses data mining perlu

(34)

berkepentingan. Tahap ini merupakan bagian dari proses KDD yang disebut

interpretation. Tahap ini mencakup pemeriksaan apakah pola atau informasi

yang ditemukan bertentangan dengan fakta atau hipotesis yang ada

sebelumnya.

6. Penerapan Data Mining

A. Analisa Pasar & Manajemen.

Sumber data yang digunakan seperti transaksi kartu kredit, kartu

anggota club tertentu, kupon diskon, keluhan pembeli, ditambah

dengan studi tentang gaya hidup public. Beberapa solusi yang dapat di

selesaikan dengan data mining antara lain [17] :

1) Menembak target pasar

Data mining dapat melakukan pengelompokkan (clustering) dari

model – model pembeli dan melakukan klasifikasi terhadap setiap

pembeli sesuai dengan karakteristik yang diingikan seperti

kedudukan yang sama, tingkat penghasilan yang sama, kebiasaan

membeli dan karakteristik lainya.

2) Melihat pola beli pemakai dari waktu ke waktu

Data mining dapat digunakan untuk melihat pola beli dari waktu

ke waktu. Sebagai contoh: ketika seseorang menikah, bisa saja

dia kemudian memutuskan untuk pindah dari single account ke

(35)

3) Cross Market Analysis

Kita dapat memanfaatkan untuk melihat hubungan antara

penjualan satu produk dengan yang lainya.

4) Profil Customer

Data mining dapat melihat profile customer sehingga dapat

mengetahui kelompok customer tertentu suka membeli produk

apa saja.

5) Identifikasi Kebutuhan Customer

Dapat mengidentifikasi produk apa saja yang terbaik untuk tiap

kelompok customer dari faktor apa saja yang dapat menarik

konsumen baru.

6) Menilai loyalitas Customer

7) Informasi Summary

Dapat digunakan untuk membuat laporan summary yang bersifat

multi dimensi dan dilengkapi dengan informasi statistic lainya

B. Analisa Perusahaan dan Manajemen Resiko.

1) Perencanaan Keuangan dan Analisa Aset

Data mining dapat membantu melakukan analisis dan prediksi

cash flow serta dapat melakukan contingent claim analysis untuk

mengetahui asset. Selain itu dapat menggunakan untuk analisis

(36)

2) Perencanaan Sumber Daya

Dengan melihat ringkasan informasi serta pola pembelanjaan dan

pemalsuan dari masing – masing resource. Maka dapat

memanfaatkan untuk resource planning.

3) Persaingan

Data mining membantu memonitor pesaing – pesaing dengan

melihat market direction mereka. Data mining juga dapat

melakukan pengelompokan customer dan dapat memberikan

variasi harga untuk masing – masing grup.

4) Telekomunikasi

Data mining melihat jutaan transaksi yang masuk, dan melihat

transaksi manakah yang harus ditangani secara manual. Tujuanya

adalah untuk menambah layanan otomatis.

2.2.4. Pengertian Decision Tree

Pohon keputusan adalah metode klasifikasi dan prediksi yang sudah terbukti

dalam mengambil keputusan. Metode ini bertujuan untuk mengubah fakta menjadi

pohon keputusan yang merepresentasikan aturan yang dapat mudah dimengerti

dengan bahasa alami. Proses dari pohon keputusan ini dimulai dari node akar

hingga node daun yang dilakukan secara rekursif dimana setiap percabangan

(37)

Algoritma Decision tree dibangun untuk sebuah pohon keputusan agar

mudah mengerti dan dapat dipahami karena dapat divisualisasikan dalam bentuk

gambar pohon keputusan, yaitu decision tree [12].

Decision tree dalam algoritma C4.5 merupakan salah satu metode

pengambil keputusan yang menggunakan Decision tree (Pohon Keputusan) dimana

setiap node mempresentasikan atribut, dimana cabang pohon keputusan

merepresentasikan nilai dari atribut tersebut [21]

Menurut [1] bahwa sebuah pohon keputusan adalah sebuah struktur yang

dapat digunakan untuk membagi kumpulan data yang besar menjadi

himpunan-himpunan record yang lebih kecil dengan menerapkan serangkaian aturan

keputusan. Dengan masing-masing rangkaian pembagian tersebut, anggota

himpunan hasil menjadi mirip satu dengan yang lainnya. Sebuah pohon keputusan

mungkin dibangun dengan cara seksama secara manual atau dapat tumbuh secara

otomatis dengan menerapkan salah satu atau beberapa algoritma pohon keputusan

untuk memodelkan himpunan data yang terklasifikasi.

Data dalam pohon keputusan biasanya dinyatakan dalam bentuk tabel

dengan atribut dan record. Atribut menyatakan suatu parameter yang dibuat sebagai

kriteria dalam pembentukan pohon. Proses pada pohon keputusan adalah mengubah

bentuk data dalam tabel menjadi model pohon dan mengubah bentuk pohon

(38)

2.2.5. Pengertian Pembentukan Pohon Keputusan Algoritma C4.5

Pohon keputusan adalah model prediksi menggunakan struktur pohon atau

struktur berhirarki.

Contoh dari pohon keputusan dapat dilihat di Gambar 2.2 berikut ini.

Gambar 2.2 Model Pohon Keputusan..

Disini setiap percabangan menyatakan kondisi yang harus dipenuhi dan tiap

ujung pohon menyatakan kelas data. Contoh di Gambar adalah identifikasi pembeli

komputer,dari pohon keputusan tersebut diketahui bahwa salah satu kelompok yang

potensial membeli komputer adalah orang yang berusia di bawah 30 tahun dan juga

pelajar. Setelah sebuah pohon keputusan dibangun maka dapat digunakan untuk

mengklasifikasikan record yang belum ada kelasnya. Dimulai dari node root,

menggunakan tes terhadap atribut dari record yang belum ada kelasnya tersebut

lalu mengikuti cabang yang sesuai dengan hasil dari tes tersebut,yang akan

membawa kepada internal node (node yang memiliki satu cabang masuk dan dua

atau lebih cabang yang keluar), dengan cara harus melakukan tes lagi terhadap

(39)

Record yang kelasnya tidak diketahui kemudian diberikan kelas yang sesuai

dengan kelas yang ada pada node daun. Pada pohon keputusan setiap simpul daun

menandai label kelas. Proses dalam pohon keputusan yaitu mengubah bentuk data

(tabel) menjadi model pohon (tree) kemudian mengubah model pohon tersebut

menjadi aturan (rule).

2.2.6. Keuntungan dan Kekurangan Algoritma C4.5 Decision Tree

Menurut [22] Algoritma C4.5 Decision tree memiliki keuntungan sebagai

berikut :

1) Mudah dimengerti dan dapat dipahami.

2) Memiliki nilai meski hanya dengan data sedikit.

3) Dapat digabungkan dengan teknik keputusan lainnya.

4) Dapat membentangkan semua permasalahan agar dapat diklasifikasikan.

5) Berfungsi menganalisa dalam mengambil keputusan mengenai

kemungkinan dari alternatif.

6) Dapat bekerja dalam mengukur hasil nilai dalam mencapai keputusan.

7) Membantu dalam membuat keputusan yang terbaik dari sumber

informasi yang ada.

Kekurangan metode Algoritma C4.5 adalah [17]:

1) Terjadi overlap terutama ketika kelas – kelas dan kriteria yang

digunakan jumlahnya sangat banyak. Hal tersebut juga dapat

menyebabkan meningkatnya waktu pengambilan keputusan dan

(40)

2) Pengakumulasian jumlah eror dari setiap tingkat dalam sebuah

keputusan yang besar.

3) Kesulitan dalam mendesain pohon keputusan yang optimal.

4) Hasil kualitas yang didapatkan dari metode pohon keputusan sangat

bergantung pada bagaimana pohon tersebut didesain.

2.2.7. Pengertian Optimasi

Menurut [18] Optimasi adalah suatu usaha atau kegiatan untuk

mendapatkan hasil terbaik dengan persyaratan yang diberikan. Menggunakan

metode optimasi pada salah satu dari dua algoritma pembelajaran bertujuan untuk

memberikan perbedaan hasil yang diperoleh. Mayoritas algoritma optimasi yang

digunakan untuk memecahkan masalah teknik adalah dengan menggunakan metode

Conjugate Gradient.

2.2.8. Pengertian Algoritma Genetika

Algoritma genetika (GA) merupakan salah satu metode data mining yang

efektif digunakan untuk pengenalan pola dan solusi masalah optimasi. Algoritma

genetika biasa digunakan untuk proses optimasi dan pencarian pola yang

menggunakan prinsip kerja seperti proses seleksi alam. Algoritma ini memiliki

konsep menyerupai proses seleksi alam dimana yang terkuat akan menjadi

pemenang, pemenang terbaik merupakan hasil yang optimal dari proses genetika

yang disebut fitness. Tahap penyelesaian yang didapatkan dari algoritma ini dapat

(41)

didipat dari setiap solusi dan setiap individu bergantung pada nilai kromosom dan

dievaluasi oleh fungsi fitness [18].

Algoritma genetika sendiri memiliki sebuah aturan populasi masing-

masing mewakili sebuah solusi untuk suatu masalah. Algoritma genetik muncul

disaat yangtepat ketika suatu masalah tersebut memerlukan optimasi sehubungan

dengan komputasi. Paradigma ini dapat diterapkan untuk memecahkan masalah

pada data mining. Tujuannya adalah untuk mengurangi error dalam

pengklasifikasian tranningset. Ide utama algoritama genetik adalah mengumpulkan

populasi yang merupakan solusi untuk suatu masalah, dan mencoba untuk

menghasilkan solusi yang lebih baik dari sebelumnya. Algoritma genetika beoperasi

melalui siklus sederhana yang terdiri dari empat tahapan sebagai berikut: insialisasi, seleksi, crossover dan mutasi [20].

Algoritma genetika memainkan peran penting dalam teknologi data mining,

yang diputuskan berdasarkan adanya karakteristik dan keunggulan

tersendiri,terutama dalamaspek berikut:

1. Algoritma genetika dapat menetapkan parameter yang langsung

beroperasi untuk mengatur dataset, antrian, matrik, grafik dan struktur

lainnya.

2. Memiliki kinerja pencarian yang lebih baik; mengurangi resiko solusi

optimalparsial. Pada saat yang sama, algoritma genetika itu sendiri juga

sangat mudahuntuk bekerja secara parallel.

(42)

4. Algoritma genetika dapat memandu arah pencarian. Algoritma genetika

memiliki tiga operator genetik utama yaitu crossover (prosespenukaran

kromosom), mutasi (proses penggantian salah satu solusi untuk

meningkatkan keragaman populasi), seleksi (penggunaan solusi dengan

nilai fitnessyang tinggi untuk lulus ke generasi berikutnya) [3].

2.3. Definisi Data

Data adalah fakta yang dapat digunakan sebagai input dalam menghasilkan

informasi. Data dapat berupa bahan untuk diskusi, pengambilan keputusan,

perhitungan atau pengukuran. Saat ini, data tidak hanya dalam bentuk kumpulan

huruf-huruf dalam bentuk kata atau kalimat, tetapi juga dapat dalam bentuk suara,

gambar diam dan bergerak, baik dalam bentuk dua maupun tiga dimensi [13]

Data merupakan bahan ‘mentah’. Sebagai bahan mentah, data merupakan

input yang setelah diolah berubah bentuknya menjadi output yang disebut informasi

[13].

2.4. Definisi Percetakan

Menurut [5], cetak digital adalah semua teknologi reproduksi yang

menerima data elektronik dan menggunakan titik (dot) untuk replikasi. Semua

mesin cetak yang memanfaatkan komputer sebagai sumber data dan proses cetak

memanfaat prinsip titik; dimana gambar atau image pada material

(kertas, plastik, tekstil, dll) tersusun dari kumpulan titik-titik.

Oleh karena itu, menurut [4] pengertian digital printing dapat digolongkan

(43)

2.5. Definisi Bagian Percetakan

Berikut adalah bagian yang ada di percetakan Awfa Digital Printing yaitu:

1. Bagian manajemen keuangan

Menurut [11] merupakan ilmu dan seni dalam mengelola uang yang

mempengaruhi kehidupan setiap orang dan setipa organisasi. Keuangan

berhubungan dengan proses, lembaga, pasar, dan instrumen yang terlibat

dalam transfer uang dimana diantara individu maupun antar bisnis dan

pemerintah.

2. Bagian manajemen operasional

Menurut [8] Manajemen operasional adalah suatu sert aktivitas yang

menciptakan nilai berupa barang dan jasa dengan melakukan

transformasi masukan menjadi keluaran.

A. Bagian Desain Grafis

[15] memaparkan beberapa pendapat tokoh akan pengertian desain grafis

sebagai berikut:

1) Menurut Suyanto desain grafis didefinisikan sebagai aplikasi dari

keterampilan seni dan komunikasi untuk kebutuhan bisnis dan

industri. Aplikasi-aplikasi ini dapat meliputi periklanan dan

penjualan produk, menciptakan identitas visual untuk institusi,

produk dan perusahaan, dan lingkungan grafis; desain informasi;

(44)

2) Sedangkan Jessica Helfand dalam situs aiga.com mendefinisikan

desain grafis sebagai kombinasi kompleks kata-kata dan gambar,

angka-angka dan grafik, foto-foto dan ilustrasi yang membutuhkan

pemikiran khusus dari seorang individu yang bisa menggabungkan

elemen-eleman ini, sehingga mereka dapat menghasilkan sesuatu

yang khusus, sangat berguna,mengejutkan atau subversif atau

sesuatu yang mudah diingat.

3) Menurut Danton Sihombing desain grafis mempekerjakan berbagai

elemen seperti marka, simbol, uraian verbal yang divisualisasikan

lewat tipografi dan gambar baik dengan teknik fotografi ataupun

ilustrasi. Elemen-elemen tersebut diterapkan dalam dua fungsi,

sebagai perangkat visual dan perangkat komunikasi.

4) Warren dalam Suyanto memaknai desain grafis sebagai suatu

terjemahan dari ide dan tempat ke dalam beberapa jenis urutan

yang struktural dan visual.

5) Sedangkan Blanchard mendefinisikan desain grafis sebagai suatu

seni komunikatif yang berhubungan dengan industri, seni dan

proses dalam menghasilkan gambaran visual pada segala

permukaan.

6) Demikian halnya senada dengan definisi yang dipaparkan Henricus

Kusbiantoro bahwa desain adalah kompromi antara seni dan bisnis.

(45)

visual, namun sekaligus tidak kehilangan karakter dan keunikan

dari segi eksekusi visual baik konsep maupun visual teknis.

2.6. Kerangka Pemikiran

Dalam penelitian ini perlu adanya kerangka pemikiran yang digunakan

untuk sebagai landasan serta pedoman agar penelitian ini berjalan sesuai dengan

alur yangdirencanakan. Permasalahan pada penelitian ini adalah belum adanya

metode yangdapat digunakan untuk mengoptimasi data penjualan barang yang

laris dan kurang laris.

Metode yang digunakan pada penelitian ini adalah algoritma C4.5

Decision tree dan jugaalgoritma genetika untuk dilakukan pengujian. Pengujian

dari metode yang telah diterapkan menggunakan cara Confusion Matrix dan

Accuracy Performance Vector (Performance). Untuk tool yangdigunakan untuk

melakukan pengujian metode adalah aplikasi RapidMiner. Adapun kerangka

(46)

(47)

BAB III

METODE PENELITIAN

3.1. Objek Penelitian

Objek penelitian ini ialah untuk menerapkan teknik data mining pada kasus

di percetakan dan diharapkan mampu memberikan informasi berupa klasifikasi

penjualan barang apa saja yang diminati oleh konsumen dan barang yang kurang

diminati. Sehingga kedepannya pemilik bisnis ini dapat melakukan analisa barang

apa saja yang laku dipasaran.

3.1.1. Sejarah Perusahaan

Percetakan awfa digital printing adalah bentuk usaha yang bergerak di

bidang advertising, dimana ruanglingkup usahanya meliputi cetak banner,

undangan, kartu nama, supplier atk, dan lain-lain. Usaha tersebut berlokasi di jalan

kavling pulo no 5 rt/rw Ds. Sukaraya Kec. Karang Bahagia Kab. Bekasi. Usaha

tersebut berdiri pada tanggal 23 agustus 2017. Usaha ini didirikan karena minimnya

pelayanan percetakan di daerah sekitar, sehingga dapat membantu kebutuhan

(48)

3.2.1. Struktur Organisasi Perusahaan

Berikut Struktur Organisasi pada Percetakan Awfa Digital Printing

Gambar 3.1 Struktur Organisasi Percetakan Awfa Digital Printing. Adapun Pembagian bidang pekerjaan (Job Desk) yang berjalan di Percetakan Awfa Digital Printing adalah sebagai berikut :

1. Pemilik

Adapun tugas dan kewenangan seorang Pemilik adalah sebagai berikut :

a. Menentukan kebijakan berkaitan pengembangan percetakan.

b. Memeriksa semua laporan mengenai perkembangan percetakan.

c. Mengawasi kinerja seluruh pegawai dan jajaran.

2. Bagian Keuangan

a. Menghitung / Mengelola keuangan penjualan.

b. Membuat laporan.

c. Memeriksa setiap laporan.

3. Bagian Operasional Operator Cetak

a. Mengelola operasional mesin percetakan.

4. Bagian Operasional Desain.

a. Membuat desain yang dipesan konsumen.

Pemilik

Bagian Keuangan

Bagian Desain

Bagian Operasional

(49)

3.3.1. Sistem yang Berjalan

Berikut ini adalah mekanisme system yang berjalan pada percetakan :

Gambar 3.2 Sistem yang Berjalan.

Berikut ini adalah penjelasan dari Sistem yang Berjalan pada Percetakan

Awfa Digital Printing pada digambar gambar tersebut:

(50)

2. Admin login terlebih dahulu untuk mencatat pesanan desain dari

konsumen. Pada saat ini admin tidak lagi menggunakan alat tulis

melainkan sudah mengoperasionalkan komputer yang sudah ada

aplikasi untuk memproses, dan akan di berikan ke desainer untuk di

buatkan desain sesuai keinginan konsumen.

3. Desainer membuat desain sesuai dengan permintaan, setelah desain

dibuat akan di perlihatkan kepada konsumen apakah desain yang di

maksud sesuai, jika dirasa tidak sesuai maka akan didesain kembali

sampai konsumen merasa bahwa pesanan yang di pesannya cukup. Jika

sudah disetujui maka tahap selanjutnya file desain tersebut akan di

berikan ke karyawan/ admin yang nantinya akan di cetak mejadi hasil

jadi.

4. Setelah dicetak desain akan diberikan kepada konsumen dengan hasil

yang sudah di finishing (rapih).

5. Dan setelah desain diterima oleh konsumen maka konsumen akan

melakukan transaski (membayar) pesanan yang telah ia pesan.

3.2. Metode Penelitian

Pada penelitian ini, data yang digunakan adalah data penjualan. Data ini

akan diolah menggunakan beberapa metode data miningsehingga diperoleh metode

yang dapat digunakan sebagai rules dalam memprediksipenjualan barang yang laris

dan kurang laris. Dalam penelitian ini akan dilakukan beberapa langkah-langkah

(51)

Gambar 3.3 Tahapan Penelitian. 1. Pengumpulan Data

Pada bagian pengumpulan data dijelaskan dari mana data dalam

penelitian ini didapatkan, meliputi data kuantitatif dan data kualitatif. Data

kuantitatif yang diperoleh dari sumber perusahaan Percetakan untuk

keperluan penelitian, sedangkan data kualitatif berisi tentang data yang

dihasilkan dari penelitian.

2. Pengolahan Awal Data

Pengelompokan awal data menjelaskan tentang tahapan awal data

mining. Pengolahan awal data meliputi proses input data ke format yang

(52)

3. Metode yang Diusulkan

Metode yang Diusulkan menjelaskan tentang metode yang diusulkan

untuk mengoptimasi klasifikasi penjualan barang yang laris dan kurang

laris. Penjelasan ini meliputi pengaturan dan pemilihan dari atribut-atribut

yang digunakan sebagai parameter dan arsitektur melalui uji coba.

4. Eksperimen dan Pengujian Metode

Pada bagian Eksperimen dan Pengujian Metode menjelaskan tentang

langkah-langkah eksperimen meliputi cara pemilihan arsitektur yang tepat

dari model atau metode yang diusulkan sehingga didapatkan hasil yang

dapat membuktikan bahwa metode yang digunakan adalah tepat.

5. Evaluasi dan Validasi Hasil

Pada bagian Evaluasi dan Validasi Hasil dijelaskan tentang evaluasi dan

validasi hasil penerapan metode pada penelitian yang dilakukan. Penjelasan

mengenai hal ini akan dijelaskan pada selanjutnya yaitu BAB IV.

3.3. Metode Pengumpulan Data

Dalam metode pengumpulan data terdapat 2 metode yaitu pengumpulan

data Kuantittif dan kualitatif. Data kuantitatif adalah data yang didapat langsung

dari sumbernya sedangkan data sekunder adalah data yang diperoleh secara tidak

(53)

Adapun jenis data yang digunakan dalam penelitian ini adalah sebagai

berikut:

1) Data kuantitatif, yaitu data yang diperoleh dari sumber perusahaan

Percetakan Awfa Digital Printing berupa dataset transaksi penjualan.

2) Data kualitatif, yaitu data yang diperoleh dari sumber penelitian untuk

mengumpulkan informasi baik secara tulisan maupun lisan. Penulis juga

mengumpulkan referensi-referensi literatur jurnal dan buku yang berkaitan

dengan algoritma C4.5 Decision Tree dan Algoritma Genetika,

menggunakan Rapidminer untuk mengolah dataset penjualan menjadi

bentuk informasi guna untuk melihat hasil penjualan laris dan kurang laris.

Berikut adalah daset yang bersumber dari percetakan.

Table 3.1 Dataset Penjualan.

DETIL ORDER PENJUALAN

PERIODE DATA : 01-03-2019 sd 31-03-2019

Tanggal No.Order Customer Nama File Bahan Resolusi Printer Ukuran Qty 01/03/2019 0001/CADP/III/19 KAFI KIAS 100X100CM APL 280 STDR MYJET MYJET 1X1 1 01/03/2019 0002/CADP/III/19 PT. ASTRA DAIHATSU MOTOR safety 260x183 cm APL 280 STDR MYJET MYJET 2.6X1.83 1 01/03/2019 0003/CADP/III/19 INDOSAT OOREDOO 4G STIKER 1X2M STICKER VINYL SUPER HIRES MYJET MYJET 1X2 1 01/03/2019 0004/CADP/III/19 AHMAD RUSBIANTO spanduk family gathering 1x3m APL 340 HIRES MYJET MYJET 3X1 1 01/03/2019 0005/CADP/III/19 PRAPTO KANGEN WATER 271x106cm APL 280 STDR MYJET MYJET 2.71X1.06 1

3.4. Pengolahan Data Awal

Pada tahap pemilihan data ini, data yang digunakan merupakan data yang

akan dilakukan test atau uji coba dengan cara memilih data yang hannya diperlukan

yaitu: dataset transaksi penjualan perbulan, Periode Data : 01-03-2019 sd

(54)

nama file, bahan yang digunakan, resolusi, printer, ukuran, Qty, harga satuan, total

harga, penerima, kasir, jam invoice. Namun data yang akan digunakan: nama bahan,

qty (jumlah), harga satuan, total harga, dan keterangan.

Tabel 3.2 Data Awal.

Tanggal 01/03/2019

No. Order 0001/CADP/III/19

Customer MARYANTO

Nama File Spanduk Family Gathering 1x3m

Bahan APL 340 Resolusi STDR MYJET Printer MYJET Ukuran 1x3m Qty 1 Harga Satuan 30000 Total Harga 90000 Penerima JAFAR Kasir INA Jam Invoice 13.41.00

3.5. Pengelolaan Data Awal

Pada dataset penjualan sebelum diolah maka harus dilakukan proses

(55)

karena tidak semua data awal yang di masukan pada tahap proses mining bias diolah

semua, hanya beberapa bagian atribut saja, seperti pada gambar berikut ini :

Tabel 3.3 Atribut yang Digunakan.

Nama Bahan APL 340

Jumlah (Qty) 1

Harga Satuan 30000

Total Harga 90000

Keterangan Laris / Kurang Laris

Data yang digunakan dalam penelitian ini hanya di ambil sebanyak 5 atribut,

karena hanya data yang berpengaruh dalam proses memining saja yang digunakan

(Berpengaruh). Agar sesuai diproses kedalam Rapidminer.

Tabel 3.4 Menentukan Barang Laris Dan Kurang Laris.

Sumber : Percetakan Awfa Digital Printing.

Ketentuan Jumlah Barang Keterangan

> 5 Laris

≤ 5 Kurang Laris

Selain itu juga penulis memberikan keterangan yang bersumber dari tempat

data tersebut di ambil yaitu di percetakan Awfa Digital Printing, batas barang apakah barang tersebut apabila kurang dari batas yang ditentukan maka “Tidak

Laris”, apabila barang yang ditentukan lebih besar maka barang tersebut “Laris”.

(56)

Tabel 3.5 Pengujian Data.

Jumlah Data 1000 100%

Data Traning 800 80%

Data Testing 200 20%

Data yang akan disiapkan untuk klasifikasi dibagi menjadi dua seperti pada

Tabel 3.5, data training (80%) dan data testing (20%). Pembagian data menjadi data training dan data testing menggunakan tools Split Validation. Split Validation

adalah teknik validasi yang membagi data menjadi dua bagian secara acak, sebagian

sebagai data training dan sebagian lainnya sebagai data testing. Dengan

menggunakan split validation akan dilakukan percobaan training berdasarkan split

ratio yang telah ditentukan sebelumnya, untuk kemudian sisa dari split ratio data

training akan dianggap sebagai data testing. Data training adalah data yang akan

dipakai dalam melakukan pembelajaran sedangkan data testing adalah data yang

belum pernah dipakai sebagai pembelajaran dan akan berfungsi sebagai data

pengujian kebenaran atau keakurasian hasil pembelajaran [19]. Berikut adalah

(57)

Gambar 3.4 Ilustrasi Split Validation.

Split Validation adalah teknik validasi yang membagi data menjadi dua

bagian secara acak, sebagian sebagai data training dan sebagian lainnya sebagai

data testing. Dengan menggunakan Split Validation akan dilakukan percobaan

training berdasarkan split ratio yang telah ditentukan sebelumnya, untuk kemudian

sisa dari split ratio data training akan dianggap sebagai data testing. Data training

adalah data yang akan dipakai dalam melakukan pembelajaran sedangkan data

testing adalah data yang belum pernah dipakai sebagai pembelajaran dan akan

berfungsi sebagai data pengujian kebenaran atau keakurasian hasil pembelajaran

(58)

1. Choosing the appropriate Data Mining task

Pada tahap ini memilih jenis data mining yang digunakan. Pada

penelitian untuk prediksi penjualan barang laris dan kurang laris maka dipilih

jenis data mining yang akandigunakan adalah klasifikasi.

2. Choosing the Data Mining Algorithm

Setelah pemilihan jenis data mining yang akan digunakan yaitu

klasifikasi, maka selanjutnya menentukan algoritma klasifikasi yang akan

digunakan yaituAlgoritma C4.5 setelah itu dioptimasi dengan menggunakan

algoritma genetika.

3. Employing the Data Mining Algorithm

Tahap ini dilakukan untuk pengolahan data dengan algoritma yang telah

dipilih untuk mendapatkan algoritma terbaik dengan tingkat akurasi yang

tinggidalam klasifikasi prediksi penjualan barang yang laris dan kurang laris.

4. Evaluation

Dalam tahap ini dilakukan evaluasi dan menafsirkan pola yang

didapatkan dari hasil algoritma yang dipakai untuk mengetahui aturan,

kehandalan, dan lain - lain. Evaluasi dilakukan dengan menerapkan pola yang

didapat dari proses sebelumnya terhadap data testing yang disediakan.

Evaluasi dilakukan dengan confusion matrix dan accuracy performance

vector. Hasil dari confusion matrix akan digunakanuntuk menampilkan hasil

Accuracy, Precision, dan Recall. Accuracy merupakanpresentase antara nilai

(59)

keberhasilan algoritma yang digunakan. Precision merupakan nilai akurasi

dengan class yang telah diprediksi [1]. Berikut adalah tabel confusionmatrix:

Tabel 3.6 Model Confusion Matrix. Classification Predicted class

Class = Yes Class = No

Class = Yes a (true positive-TP) b (false negative-FN)

Class = No c (false positive-FP) d (true negative-TN)

Rumus untuk menghitung tingkat akurasi pada

matrik adalah : Accuracy = 𝑇𝑃+𝑇𝑁 𝑇𝑃+𝐹𝑃+𝑇𝑁+𝐹𝑁 = 𝐴+𝐷 𝐴+𝐵+𝐶+𝐷 Keterangan :

a : jika nilai prediksi positif dan kelas sebenarnya positif

b : jika nilai prediksi negatif dan kelas sebenarnya positif

c : jika nilai prediksi positif dan kelas sebenarnya negatif

d : jika nilai prediksi negatif dan kelas sebenarnya negatif

Berikut adalah rumus untuk menghitung Accuracy :

Accuracy = 𝐴+𝐷

𝑎+𝑏+𝑐+𝑑

Berikut adalah rumus untuk menghitung Recall :

Recall = 𝑎

𝑎+𝑐

(60)

Precision = 𝑎

𝑎+𝑏

5. Using the discovered knowledge

Pada tahap ini menggunakan pengetahuan yang diperoleh dari proses

data mining untuk penerapan pada aplikasi atau lainnya. Pengetahuan

klasifikasi dataset diterapkan pada data baru untuk membuat klasifikasi

penjualan barang yang laris dan kurang laris.

3.6. Metode yang Diusulkan

Dalam penelitian ini melalui tahapan dilakukannya uji coba menggunakan

metode algoritma C4.5 dan Optimasi GA (Genetic Algorithm). Data dianalisa

dengan menggunakan algoritma sesuai dengan metode yang telah di rencanakan,

setelah itu membandingkan metode dengan optimasi GA (Genetic Algorithm)

untuk melihat perbandingan tertinggi timgkat akurasi. Pada tahapan uji coba ini

akan dilakukan beberapa langkah atau tahapan pengujiandata yaitu seperti berikut:

(61)

Dari gambar metode yang diusulkan akan mendapat dan mengetahui hasil

yang didapatkan oleh algoritma C4.5, kemudian pada hasil tersebut akan

ditambahkan algoritma genetika sebagai optimasi yang digunakan untuk

meningkatkan hasil dari algoritma C4.5. Padatahap akhir hasil dari keduanya akan

dibandingkan sehingga akan diketahui hasil dari uji coba seberapa efektifnya

(62)

BAB IV

HASIL PENGUJIAN DAN PEMBAHASAN

4.1. Hasil Pengujian

Hasil penelitian pengujian untuk mengetahui hasil dari suatu proses

penelitian. Berikut adalah beberapa hasil pengujianyang telah dilakukan :

4.1.1. Pengujian Decision Tree

Tahapan awal yang dilakukan dalam penelitian ini yaitu mempersiapkan

dataset penjualan barang yang didapatkan dari sumber yaitu percetakan awfa digital

printing. Data yang diambil adalah dataset penjualan barang yang merupakan data

yang berjumlah 1000 data danmemiliki 5 atribut.

Tabel 4.1 Data yang Digunakan.

Nama Bahan Jumlah Harga Satuan Total Harga Keterangan

APL 280 5 9000 45000 Laris

APL 340 3 30000 90000 Laris

AP 150 2 2500 5000 Kurang Laris

APL 440 1 40000 40000 Laris

APL 280 7 9000 63000 Kurang Laris

AP 150 10 2500 25000 Laris

APL 340 12 30000 360000 Laris

Pada Tabel 4.1 data awal yaitu “Data yang Digunakan” dataset uji coba,

harus dikelola terlebih dahulu karena peneliti menganggap ada data yang tidak

(63)

tersebut antara lain yang didalamnya terdapat atribut seperti : tanggal, no order,

nama customer, nama file, bahan yang digunakan, resolusi, printer, ukuran, Qty,

harga satuan, total harga, penerima, kasir, jam invoice. Namun data yang akan

digunakan hanya atribut: nama bahan, qty (jumlah), harga satuan, total harga, dan

keterangan. pengujian menggunakan operator yang terdapat pada aplikasi

RapidMiner. Setelah data dianggap sudah cukup maka tahap selanjutnya adalah

pengujian pada aplikasi RapidMiner. Pengujian ini menggunakan Aplikasi

RapidMiner 9.3.Adapun operators yang digunakan yaitu sebagai berikut :

Pertama peneliti menggunakan operators Read Excel yang digunakan untuk

melakukan import dataset dengan cara pilih Import Configuration Wizard lalu pilih

data yang akan dikelola dan pilih atribut yang akan melalui tahapan proses

pengolahan data, maka akantampil hasil seperti berikut :

Gambar 4.1 Import Dataset.

Pada gambar tersebut menampilkan isi dari dataset yang akan diolah. Lalu pilih “finish” untuk ke tahap selanjutnya.

(64)

Gambar 4.2 Tampilan Operator yang Digunakan.

Penggunaan Tool Examples berfungsi untuk mengisi data, atau atribut yang

missing data (data yang tidak terisi) lalu pilih atribut yang datanya tidak terisi lalu “Ok”. Maka jika menggunakan Tools ini data akan terisi diambil nilai rata-rata

secara otomatis pada Rapidminer. Penggunaan operator ini juga, jika data yang

dimasukan ada kesalahan atau terjadi Human error pada saat data awal yang

sebelumnya diolah agar dapat di proses oleh Aplikasi Rapidminer.

Set Role menentukan parameter atribut yang akan dijadikan hasil dari bentuk pohon keputusan. Setelah itu klik “Set Role”, maka akan muncul tampilan dipojok

atas kanan, pilih “Atribut Name”. Atribut yang dipilih adalah atribut “Keterangan”,