• Tidak ada hasil yang ditemukan

Penerapan Data Mining Pada penjualan Produk Minuman Di PT. Pepsi Cola Indobeverages Menggunakan Metode Clustering

N/A
N/A
Protected

Academic year: 2017

Membagikan "Penerapan Data Mining Pada penjualan Produk Minuman Di PT. Pepsi Cola Indobeverages Menggunakan Metode Clustering"

Copied!
168
0
0

Teks penuh

(1)

PENERAPAN DATA MINING PADA PENJUALAN PRODUK

MINUMAN DI PT. PEPSI COLA INDOBEVERAGES

MENGGUNAKAN METODE CLUSTERING

SKRIPSI

Diajukan untuk Menempuh Ujian Akhir Sarjana Program Strata Satu Jurusan Teknik Informatika

Fakultas Teknik dan Ilmu Komputer Universitas Komputer Indonesia

Oleh :

ENUR IRDIANSYAH

10105140

JURUSAN TEKNIK INFORMATIKA

FAKULTAS TEKNIK DAN ILMU KOMPUTER

UNIVERSITAS KOMPUTER INDONESIA

BANDUNG

(2)

PENERAPAN DATA MINING PADA PENJUALAN PRODUK

MINUMAN DI PT. PEPSI COLA INDOBEVERAGES

MENGGUNAKAN METODE CLUSTERING

ENUR IRDIANSYAH

10105140

Pembimbing,

Andri Heryandi, S.T., M.T. NIP. 41277006007

Menyetujui,

Ketua Jurusan Teknik Informatika

(3)

PENERAPAN DATA MINING PADA PENJUALAN PRODUK

MINUMAN DI PT. PEPSI COLA INDOBEVERAGES

MENGGUNAKAN METODE CLUSTERING

ENUR IRDIANSYAH

10105140

Penguji I Penguji II

Irfan Maliki, S.T. Andri Heryandi, S.T., M.T.

NIP. 41277006019 NIP. 41277006007

Penguji III

(4)

i

 

ABSTRAK

PENERAPAN

DATA MINING

PADA PENJUALAN PRODUK

MINUMAN DI PT. PEPSI COLA INDOBEVERAGES

MENGGUNAKAN METODE

CLUSTERING

Oleh

Enur Irdiansyah

10105140

Dalam dunia bisnis yang selalu dinamis dan penuh persaingan, para pelakunya harus senantiasa memikirkan cara-cara untuk terus survive dan jika mungkin mengembangkan skala bisnis mereka.

PT. Pepsi Cola Indobeverages merupakan perusahaan yang bergerak dalam bidang industri minuman. Sebagai perusahaan besar, PT. Pepsi Cola Indobeverages menghasilkan berbagai macam produk minuman dengan nama dan kemasan yang berbeda. Tidak hanya PT. Pepsi Cola Indobeverages, masih cukup banyak perusahaan-perusahaan lain yang bergerak dibidang serupa. Hal tersebut tentu saja menimbulkan persaingan bisnis antarperusahaan.

Dalam rangka menghadapi persaingan bisnis dan meningkatkan pendapatan perusahaan, pihak terkait dalam perusahaan tersebut dituntut untuk dapat mengambil keputusan yang tepat dalam menentukan strategi pemasaran produk minuman yang akan dijualnya.

Ketersediaan data yang melimpah, kebutuhan akan informasi (atau pengetahuan) sebagai pendukung pengambilan keputusan untuk membuat solusi bisnis, dan dukungan infrastruktur di bidang teknologi informasi merupakan cikal-bakal dari lahirnya teknologi data mining. Data mining dimaksudkan untuk memberikan solusi nyata bagi para pengambil keputusan di dunia bisnis, untuk mengembangkan bisnis mereka.

Data mining didefinisikan sebagai satu set teknik yang digunakan secara otomatis untuk mengeksplorasi secara menyeluruh dan membawa ke permukaan relasi-relasi yang kompleks pada set data yang sangat besar. Salah satu metode yang terdapat dalam data mining yang digunakan dalam penelitian ini adalah pengelompokan (Clustering) dimana metode tersebut mengidentifikasi objek yang memiliki kesamaan karakteristik tertentu, dan kemudian menggunakan karakteristik tersebut sebagai “vektor karakteristik” atau “centroid”.

Hasil dari penelitian ini adalah aplikasi yang dapat mempermudah menganalisis sejumlah data yang besar guna membantu memberikan informasi berharga sebagai gambaran dasar pengambilan keputusan perusahaan.

(5)

ii

 

ABSTRACT

DATA MINING APPLICATION OF BEVERAGE PRODUCTS

MARKETING IN PEPSI COLA INDOBEVERAGES COMPANY

USING CLUSTERING METHOD

By

Enur Irdiansyah

10105140

In the dynamic and very competitive world of commerce or business, the people involved have to be fully prepared of the ways to surviving and developing their business range.

Pepsi Cola Indobeverages Company is a consumer products company focused on beverages. As a big company, Pepsi Cola Indobeverages Company seeks to produce various beverage products with different names and packages. Pepsi Cola Indobeverages Company is not the only one company that focused on beverages in Indonesia, there are several companies with similar direction. It is surely arising business competitions among the companies.

To be up against the business competitions and to improve company financial rewards, the company must have an ability to take the appropriate decision of definitive marketing strategies of their beverage products.

The availability of abundant data, the necessity of information (or knowledge) as the proponent to take the appropriate decision of establishing business solutions, and the infrastructure supports in information technology are the pioneers of data mining technology. Data mining purpose is to give the real solution for the decision maker of business, and to developing their business range.

Data mining is defined as one technique set that automatically used to explore comprehensively and bring the complex relations to the surface in the huge data set. The one of data mining method that used in this research is Clustering, it is identify object with the similarity of certain characteristics, and then using those characteristics as the “vector characteristic” or “centroid”.

The result of this research is an application that will make analyze of huge data set easier then helpful to give information as a basic feature of company’s decision makers.

Keywords: business competition, business solution, information technology, data mining, clustering

(6)

vi   

LEMBAR PENGESAHAN

ABSTRAK ... i

ABSTRACT ... ii

KATA PENGANTAR ... iii

DAFTAR ISI ... vi

DAFTAR TABEL ... xii

DAFTAR GAMBAR ... xiv

DAFTAR SIMBOL ... xvii

DAFTAR LAMPIRAN ... xix

BAB I PENDAHULUAN ... 1

1.1.Latar Belakang Masalah ... 1

1.2.Perumusan Masalah ... 3

1.3.Maksud dan Tujuan ... 4

1.4.Batasan Masalah ... 4

1.5.Metodologi Penelitian ... 5

1.6.Sistematika Penulisan ... 7

BAB II TINJAUAN PUSTAKA ... 9

2.1.Tinjauan Tempat Penelitian ... 9

2.1.1. Sejarah Perusahaan ... 9

(7)

vii   

2.2.Landasan Teori ... 18

2.2.1. Pengertian Data Mining... 18

2.2.2. Tahapan Data Mining ... 20

2.2.3. Arsitektur Data Mining ... 22

2.2.4. Pengelompokkan (Clustering) ... 23

2.2.4.1. Teknik Clustering ... 26

2.2.4.2. Hierarchical Clustering ... 27

2.2.4.3. Agglomerative ... 27

2.2.4.4. Divisive ... 28

2.2.4.5. Partitional Clustering ... 29

2.2.4.6. Agglomerative Hierarchical Clustering Algorithm (AHC Algorithm) ... 29

2.2.4.7. Contoh Penerapan Clustering Menggunakan Algoritma AHC ... 32

2.2.5. Konsep Dasar Data dan Informasi ... 35

2.2.5.1. Pengertian Data ... 35

2.2.5.2. Pengertian Informasi ... 35

2.2.6. Basis Data (Database) ... 36

2.2.7. Database Management System (DBMS)... 38

2.2.8. ERD (Entity Relationship Diagram)... 40

(8)

viii   

BAB III ANALISIS DAN PERANCANGAN SISTEM ... 49

3.1.Analisis Sistem ... 49

3.1.1. Analisis Masalah... 49

3.1.2. Analisis Non Fungsional dan Kebutuhan Non Fungsional ... 51

3.1.2.1. Analisis Perangkat Keras ... 51

3.1.2.2. Analisis Perangkat Lunak ... 52

3.1.2.3. Analisis User (Pengguna) ... 52

3.1.3. Analisis Basis Data ... 53

3.2.Analisis Kebutuhan Fungsional ... 55

3.2.1. Diagram Konteks ... 55

3.2.2. Data Flow Diagram (DFD) ... 56

3.2.2.1. DFD Level 1 ... 56

3.2.2.2. DFD Level 2 Proses Pengolahan Data Master ... 57

3.2.2.3. DFD Level 2 Proses Clustering ... 57

3.2.2.4. DFD Level 3 Proses Pengolahan Data User ... 58

3.2.2.5. DFD Level 3 Proses Input Parameter Kelas Wilayah Penjualan ... 59

3.2.2.6. DFD Level 3 Proses Buat Clustering ... 60

3.2.3. Spesifikasi Proses ... 61

3.2.4. Kamus Data ... 74

(9)

ix   

3.3.2. Perancangan Antar Muka ... 81

3.3.2.1. Perancangan Tampilan Program ... 81

3.3.2.1.1. Tampilan Awal Aplikasi ... 81

3.3.2.1.2. Tampilan Login User ... 82

3.3.2.1.3. Tampilan Menu Utama Setelah Login User... 82

3.3.2.1.4. Tampilan Sub Menu User/Operator ... 83

3.3.2.1.5. Tampilan Sub Menu Hak Akses Menu ... 83

3.3.2.1.6. Tampilan Sub Menu Kelas Wilayah Penjualan ... 84

3.3.2.1.7. Tampilan Sub Menu Import Data Penjualan ... 84

3.3.2.1.8. Tampilan Sub Menu Analisa Clustering ... 85

3.3.2.1.9. Tampilan Sub Menu Ganti Password ... 85

3.3.2.1.10. Tampilan Menu About ... 86

3.3.2.1.11. Tampilan Tambah Data User ... 86

3.3.2.1.12. Tampilan Edit Data User ... 86

3.3.2.1.13. Tampilan History ... 87

3.3.2.1.14. Tampilan Lihat Progress ... 87

3.3.2.2. Perancangan Pesan ... 88

3.3.3. Perancangan format input/import dan output/eksport ... 89

3.3.3.1. Perancangan format input/import ... 89

(10)

x   

4.1.Implementasi Sistem ... 99

4.1.1. Implementasi Perangkat Keras ... 99

4.1.2. Implementasi Perangkat Lunak ... 100

4.1.3. Implementasi Form ... 100

4.1.4. Implementasi Basis Data ... 101

4.1.5. Implementasi Antar Muka ... 107

4.1.6. Implementasi Pesan ... 114

4.2.Pengujian ... 116

4.2.1. Rencana Pengujian ... 116

4.2.2. Kasus dan Hasil Pengujian Alpha ... 117

4.2.2.1. Pengujian Login ... 117

4.2.2.2. Pengujian Pengolahan Data User ... 118

4.2.2.3. Pengujian Pengolahan Hak Akses User ... 121

4.2.2.4. Pengujian Input Kelas Wilayah Penjualan ... 123

4.2.2.5. Pengujian Import Data Penjualan ... 124

4.2.2.6. Pengujian Analisa Clustering ... 125

4.2.2.7. Pengujian Ganti Password ... 127

4.2.3. Kesimpulan Hasil Pengujian Alpha ... 129

4.2.4. Kasus dan Hasil Pengujian Beta ... 129

(11)

xi   

(12)

xii   

DAFTAR TABEL

Tabel 2.1 Data Penjualan Minuman Per Wilayah Tanggal 1 Januari 2007 ... 32

Tabel 2.2 Pembuatan cluster pertama ... 33

Tabel 2.3 Hasil clustering sebanyak tiga cluster ... 34

Tabel 3.1 Karakteristik Pengguna ... 52

Tabel 3.2 Spesifikasi Proses ... 61

Tabel 3.3 Kamus Data Proses Login ... 74

Tabel 3.4 Kamus Data : Data Penjualan ... 74

Tabel 3.5 Kamus Data : Parameter Kelas Wilayah ... 75

Tabel 3.6 Kamus Data : Data history ... 75

Tabel 3.7 Kamus Data : Data detail history ... 75

Tabel 3.8 Kamus Data : Data cluster ... 75

Tabel 3.9 Struktur Tabel User (m_user) ... 77

Tabel 3.10 Struktur Tabel Hak Akses (m_trustee_01)... 77

Tabel 3.11 Struktur Tabel Penjualan (t_penjualan) ... 77

Tabel 3.12 Struktur Tabel Produk (m_product) ... 78

Tabel 3.13 Struktur Tabel Kelas Wilayah (m_kelaswilayah) ... 78

Tabel 3.14 Struktur Tabel History (history) ... 78

Tabel 3.15 Struktur Tabel Detail History (detail_history) ... 78

Tabel 3.16 Struktur Tabel Cluster (cluster) ... 79

Tabel 3.17 Struktur Tabel Temporary (tmp1) ... 79

(13)

xiii   

Tabel 4.1 Implementasi Form ... 100

Tabel 4.2 Rencana Pengujian Aplikasi Data Mining PT. PEPSI COLA INDOBEVERAGES ... 116

Tabel 4.3 Pengujian Verifikasi User ID dan Password... 117

Tabel 4.4 Pengujian Pengolahan Data User ... 118

Tabel 4.5 Pengujian Pengolahan Hak Akses User ... 121

Tabel 4.6 Pengujian Input Kelas Wilayah Penjualan ... 123

Tabel 4.7 Pengujian Import Data Penjualan ... 124

Tabel 4.8 Pengujian Analisa Clustering... 125

(14)

xiv 

 

Gambar 2.1 Struktur Organisasi Perusahaan ... 18

Gambar 2.2 Tahapan pada proses knowledge discovery ... 20

Gambar 2.3 Arsitektur Data Mining ... 23

Gambar 2.4 Ilustrasi Clustering ... 25

Gambar 2.5 Pengelompokan himpunan data menjadi tiga cluster ... 25

Gambar 2.6 Agglomerative dan Divisive ... 27

Gambar 3.1 Entity Relationship Diagram (ERD) ... 54

Gambar 3.2 Diagram Konteks... 55

Gambar 3.3 DFD Level 1 ... 56

Gambar 3.4 DFD Level 2 Proses Pengolahan Data Master ... 57

Gambar 3.5 DFD Level 2 Proses Clustering ... 58

Gambar 3.6 DFD Level 3 Proses Pengolahan Data User ... 59

Gambar 3.7 DFD Level 3 Proses Input Parameter Kelas Wilayah Penjualan ... 60

Gambar 3.8 DFD Level 3 Proses Buat Cluster ... 61

Gambar 3.9 Skema Relasi ... 76

Gambar 3.10 Perancangan Struktur Menu ... 80

Gambar 3.11 Tampilan Awal Aplikasi ... 81

Gambar 3.12 Tampilan Login User ... 82

Gambar 3.13 Tampilan Menu Utama Setelah Login User ... 82

(15)

xv 

 

Gambar 3.18 Tampilan Sub Menu Analisa Clustering ... 85

Gambar 3.19 Tampilan Sub Menu Ganti Password ... 85

Gambar 3.20 Tampilan Menu About ... 86

Gambar 3.21 Tampilan Tambah Data User ... 86

Gambar 3.22 Tampilan Edit Data User ... 87

Gambar 3.23 Tampilan History... 87

Gambar 3.24 Tampilan Lihat Progress ... 88

Gambar 3.25 Tampilan Perancangan Pesan ... 88

Gambar 3.26 Tampilan Perancangan Format input/import... 90

Gambar 3.27 Tampilan Perancangan Format output/eksport ... 90

Gambar 3.28 Perancangan Prosedural Flowchart login ... 91

Gambar 3.29 Perancangan Prosedural Flowchart tambah data ... 92

Gambar 3.30 Perancangan Prosedural Flowchart edit data ... 93

Gambar 3.31 Perancangan Prosedural Flowchart hapus data ... 94

Gambar 3.32 Perancangan Prosedural Flowchart import data ... 95

Gambar 3.33 Perancangan Prosedural Flowchart eksport data ... 96

Gambar 3.34 Perancangan Prosedural Flowchart ganti password ... 97

Gambar 3.35 Jaringan Semantik ... 98

Gambar 4.1 Form Tampilan Awal Aplikasi ... 107

(16)

xvi 

 

Gambar 4.6 Form Edit User ... 109

Gambar 4.7 Form Pengolahan Hak Akses User... 109

Gambar 4.8 Form Wilayah Penjualan Per Kelas ... 110

Gambar 4.9 Form Import Data Penjualan ... 110

Gambar 4.10 Form Cari File ... 111

Gambar 4.11 Form Analisa Clustering ... 111

Gambar 4.12 Form Ganti Password ... 112

Gambar 4.13 Form About ... 112

Gambar 4.14 Laporan Daftar User... 113

Gambar 4.15 Laporan Hasil Analisa Clustering ... 113

Gambar 4.16 Form History ... 114

Gambar 4.17 Form Lihat Progress ... 114

(17)

xvii

Simbol Nama Keterangan

Entity Menunjukkan himpunan entitas

Garis Menunjukkan penghubung antara

himpunan relasi dengan himpunan entitas dan himpunan entitas dengan atributnya

Belah ketupat / Relationship

Menunjukkan himpunan relasi

Atribut Menunjukan item data yang menjadi bagian dari suatu entitas

2. Simbol DataFlowDiagram

Simbol Nama Keterangan

Proses Menunjukkan kegiatan / kerja yang dilakukan oleh orang, mesin atau komputer

Terminator Menunnjukkan bagian dari luar

Arus / Aliran data

Menunjukkan arus dari proses

(18)

xviii

Garis alir

(flow line)

Arah aliran program

Proses Proses perhitungan/proses

pengolahan data

Input/output data Proses input/output data, parameter, informasi

Decision Perbandingan pernyataan,

(19)

xix  

Lampiran B Hasil Kuesioner ... B-1

(20)

1

1.1Latar Belakang Masalah

Dalam dunia bisnis yang selalu dinamis dan penuh persaingan, para

pelakunya harus senantiasa memikirkan cara-cara untuk terus survive dan jika

mungkin mengembangkan skala bisnis mereka. Untuk mencapai hal itu, ada tiga

kebutuhan bisnis yang dapat dilakukan, yaitu penambahan jenis maupun

peningkatan kapasitas produk, pengurangan biaya operasi perusahaan, dan

peningkatan efektifitas pemasaran dan keuntungan. Agar bisa memenuhi

kebutuhan-kebutuhan bisnis di atas banyak cara yang dapat ditempuh, salah

satunya adalah dengan melakukan analisis data perusahaan.

PT. Pepsi Cola Indobeverages merupakan perusahaan yang bergerak

dalam bidang industri minuman. Sebagai perusahaan besar, PT. Pepsi Cola

Indobeverages menghasilkan berbagai macam produk minuman dengan nama

yang berbeda. Tidak hanya PT. Pepsi Cola Indobeverages, masih cukup banyak

perusahaan-perusahaan lain yang bergerak di bidang serupa. Hal tersebut tentu

saja menimbulkan persaingan bisnis antar perusahaan.

Produk minuman yang diproduksi oleh PT. Pepsi Cola Indobeverages

tersebut selain memiliki nama yang berbeda, setiap nama dari minuman tersebut

pun memiliki kemasan yang beragam pula. Produk-produk minuman yang

diproduksi tersebut dipasarkan ke banyak kota-kota di Indonesia. Hal ini tentu

(21)

Untuk menghadapi persaingan bisnis yang dinamis pihak perusahaan

dituntut agar dapat mengambil keputusan yang tepat dalam menentukan strategi

pemasaran produk yang akan dijualnya. Agar dapat melaksanakan hal tersebut,

perusahaan memerlukan informasi yang cukup untuk dapat dianalisa lebih lanjut.

Informasi yang dihasilkan tentunya adalah hasil analisis dari pengolahan data

penjualan pada perusahaan tersebut. Data penjualan yang sudah ada akan diolah

atau dianalisis untuk mengetahui tingkat kecenderungan konsumen di setiap

tempat tujuan pemasaran produk pada faktor ketertarikannya. Dari pengolahan

data tersebut akan diperoleh suatu pola konsumsi masyarakat terhadap produk dari

perusahaan tersebut.

Ketersediaan data yang melimpah, kebutuhan akan informasi (atau

pengetahuan) sebagai pendukung pengambilan keputusan untuk membuat solusi

bisnis, dan dukungan infrastruktur di bidang teknologi informasi merupakan

cikal-bakal dari lahirnya teknologi data mining. Data mining dimaksudkan untuk

memberikan solusi nyata bagi para pengambil keputusan di dunia bisnis, untuk

mengembangkan bisnis mereka.

Data mining didefinisikan sebagai satu set teknik yang digunakan secara

otomatis untuk mengeksplorasi secara menyeluruh dan membawa ke permukaan

relasi-relasi yang kompleks pada set data yang sangat besar. Set data yang

dimaksud di sini adalah set data yang berbentuk tabulasi, seperti yang banyak

diimplementasikan dalam teknologi manajemen basis data relasional. Akan tetapi,

teknik-teknik data mining dapat juga diaplikasikan pada representasi data yang

(22)

mining dapat juga didefinisikan sebagai “pemodelan dan penemuan pola-pola

yang tersembunyi dengan memanfaatkan data dalam volume yang besar” Data

mining menggunakan pendekatan discovery-based dimana pencocokan pola

(pattern-matching) dan algoritma-algoritma yang lain digunakan untuk

menentukan relasi-relasi kunci di dalam data yang diekplorasi. Data mining

merupakan komponen baru pada arsitektur sistem pendukung keputusan (SPK) di

perusahaan-perusahaan.

Pengelompokan (Clustering) mengidentifikasi objek yang memiliki

kesamaan karakteristik tertentu, dan kemudian menggunakan karakteristik

tersebut sebagai “vektor karakteristik” atau “centroid”. Pengelompokan ini

digunakan oleh perusahaan untuk membuat laporan mengenai karakteristik umum

dari grup-grup konsumen yang berbeda. Proses Clustering yang akan dilakukan

menggunakan Agglomerative Hierarchical Clustering Algorithm (AHC

algorithm).

Dari pertimbangan atas penjelasan yang telah dipaparkan diatas, maka

dibuatlah suatu aplikasi PENERAPAN DATA MINING PADA PENJUALAN

PRODUK MINUMAN DI PT. PEPSI COLA INDOBEVERAGES

MENGGUNAKAN METODE CLUSTERING.

1.2 Identifikasi Masalah

Dengan mengacu pada latar belakang masalah diatas, maka permasalahan

(23)

Bagaimana cara menerapkan Data Mining pada penjualan produk minuman di PT.

PEPSI COLA INDOBEVERAGES menggunakan metode clustering.

1.3Maksud dan Tujuan

Berdasarkan permasalahan yang diteliti, maka maksud dari penulisan tugas

akhir ini adalah untuk membangun aplikasi Data Mining pada penjualan produk

minuman di PT. Pepsi Cola Indobeverages menggunakan metode clustering.

Sedangkan tujuan yang akan dicapai dalam penelitian ini antara lain :

1. Mempermudah menganalisis data yang besar

2. Membantu memberikan informasi dari data penjualan yang diolah

3. Memberikan gambaran dalam pengambilan keputusan

1.4Batasan Masalah

Adapun batasan masalah yang akan dibahas adalah :

1. Data yang akan dianalisa merupakan data penjualan produk minuman

di PT. PEPSI COLA INDOBEVERAGES.

2. Algoritma yang digunakan dalam metode clustering yang dilakukan

adalah Agglomerative Hierarchical Clustering Algorithm (AHC).

3. Format file yang akan diinputkan berupa file database dengan

berekstensi excel atau xls.

4. Hasil dari analisa tersebut adalah terbentuknya pola penjualan produk

minuman di PT. PEPSI COLA INDOBEVERAGES.

(24)

6. Metode yang digunakan adalah metode aliran terstruktur dimana tools

yang digunakan adalah Data Flows Diagram (DFD) dan Entity

Relationship Diagram (ERD).

7. Aplikasi ini dibangun dengan menggunakan bahasa pemrograman

Pascal dengan aplikasi pemrograman Borland Delphi 7 dan Database

menggunakan MySQL.

1.5Metodologi Penelitian

Metodologi yang digunakan dalam penulisan tugas akhir ini adalah

sebagai berikut :

1. Tahap pengumpulan data

Metode pengumpulan data yang digunakan dalam penelitian ini adalah sebagai

berikut :

a. Studi Literatur

Pengumpulan data dengan cara mengumpulkan literatur, jurnal, paper dan

bacaan-bacaan yang ada kaitannya dengan judul penelitian.

b. Observasi

Teknik pengumpulan data dengan mengadakan penelitian dan peninjauan

langsung terhadap permasalahan yang diambil.

c. Interview

Teknik pengumpulan data dengan mengadakan tanya jawab secara langsung

(25)

2. Tahap pembuatan perangkat lunak.

Teknik analisis data dalam pembuatan perangkat lunak menggunakan

pemodelan perangkat lunak dengan paradigma waterfall seperti terlihat pada

Gambar 1.1, yang meliputi beberapa proses diantaranya:

a. System / Information Engineering

Merupakan bagian dari sistem yang terbesar dalam pengerjaan suatu proyek,

dimulai dengan menetapkan berbagai kebutuhan dari semua elemen yang

diperlukan sistem dan mengalokasikannya kedalam pembentukan perangkat

lunak.

b. Analisis

Merupakan tahap menganalisis hal-hal yang diperlukan dalam pelaksanaan

proyek pembuatan perangkat lunak.

c. Design

Tahap penerjemahan dari data yang dianalisis kedalam bentuk yang mudah

dimengerti oleh user.

d. Coding

Tahap penerjemahan data atau pemecahan masalah yang telah dirancang

keadalam bahasa pemrograman tertentu.

e. Pengujian

(26)

f. Maintenance

Tahap akhir dimana suatu perangkat lunak yang sudah selesai dapat

mengalami perubahan–perubahan atau penambahan sesuai dengan

permintaan user.

Gambar 1.1 Paradigma Waterfall

1.6Sistematika Penulisan

Sistematika penulisan penelitian tugas akhir ini disusun untuk memberikan

gambaran umum tentang penelitian yang dijalankan. Sistematika penulisan tugas

akhir ini adalah sebagai berikut :

BAB I. PENDAHULUAN

Bab ini menguraikan tentang latar belakang permasalahan, mencoba

mengidentifikasi inti permasalahan yang dihadapi, menentukan maksud dan

tujuan penelitian, yang kemudian diikuti dengan pembatasan masalah, metodologi

(27)

BAB II. TINJAUAN PUSTAKA

Bab ini membahas tentang tinjauan perusahaan serta berbagai konsep

dasar dan teori-teori yang berkaitan dengan topik penelitian yang dilakukan dan

hal-hal yang berguna dalam proses analisis permasalahan serta tinjauan terhadap

penelitian-penelitian serupa yang telah pernah dilakukan sebelumnya termasuk

sintesisnya.

BAB III. ANALISIS DAN PERANCANGAN SISTEM

Bab ini menganalisis masalah dari data hasil penelitian, kemudian

dilakukan pula proses perancangan sistem yang akan dibangun sesuai dengan analisa

yang telah dilakukan.

BAB IV. IMPLEMENTASI DAN PENGUJIAN

Bab ini berisi tentang implementasi dari tahapan-tahapan penting yang

telah dilakukan sebelumnya kemudian dilakukan pengujian terhadap sistem sesuai

dengan tahapan yang telah dijalani untuk memperlihatkan sejauh mana system

yang dibangun layak digunakan.

BAB V. KESIMPULAN DAN SARAN

Bab ini berisi mengenai kesimpulan atas tugas akhir yang dibuat serta

berisi saran-saran untuk adanya pengembangan mutu dan kualitas bagi masa yang

(28)

9

2.1Tinjauan Tempat Penelitian

2.1.1 Sejarah Perusahaan

1965 PepsiCo, Inc. didirikan oleh Donald M. Kendall, Presiden dan

Eksekutif Utama (Chief Executive Officer/CEO) Pepsi-Cola, dan

Herman W. Lay, Pimpinan dan CEO Frito-Lay, melalui

penggabungan kedua perusahaan. Pepsi-Cola diciptakan saat Caleb

Bradham, seorang ahli farmasi dari New Bern, Carolina Utara,

Amerika Serikat, pada akhir tahun 1890-an menciptakan sebuah

minuman bernama “Minuman Brad” (“Brad’s drink”) dengan

tujuan untuk mengobati sakit perut. Minuman itu terbuat dari air

berkarbonat, gula, vanila, minyak pati, pepsin, dan buah kola. Pada

28 Agustus 1898, nama “Minuman Brad” diubah menjadi

“Pepsi-Cola” dan kemudian nama itu didaftar pada 16 Juni 1903. Bradham

memperoleh nama Pepsi dari penyakit dyspepsia (sakit perut atau

ketidakcernaan). Frito-Lay, Inc. dibentuk pada tahun 1961 melalui

gabungan Perusahaan Frito, yang didirikan oleh Elmer Doolin pada

tahun 1932, dan Perusahaan H. W. Lay, yang didirikan oleh

Herman W. Lay pada tahun 1932. Herman Lay sebagai Pimpinan

(29)

1966

1971

Kendall sebagai Presiden dan CEO. Perusahaan yang baru ini

memiliki laporan penjualan sebesar 510 juta dolar dan

mempekerjakan 19.000 (sembilan belas ribu) pegawai.

Produk-produk utama dari perusahaan baru ini yaitu:

1. Pepsi-Cola Company – Pepsi-Cola (diformulasikan pada

tahun 1898), Diet Pepsi (1964) dan Mountain Dew

(diperkenalkan oleh Tip Corporation pada tahun 1948).

2. Frito-Lay, Inc. – Keripik jagung merk Fritos (diciptakan

oleh Elmer Doolin pada tahun 1932, keripik kentang merk

Lay’s (diciptakan oleh Herman W. Lay pada tahun 1938),

makanan ringan berperencah keju merk Cheetos (1948),

keripik kentang merk Ruffles (1958) dan kue kering asin

merk Rold Gold (diperoleh pada tahun 1961).

Pepsi memasuki Jepang dan Eropa bagian Timur

CEO PepsiCo, Donald M. Kendall memangku jabatan Pimpinan

Dewan Direktur pada saat pensiunnya Herman W. Lay. Lay tetap

memegang peranan penting dalam korporasi sampai beliau

meninggal pada tanggal 6 Desember 1982.

Andral E. Pearson ditunjuk menjadi presiden Pepsico, jabatan

(30)

1973

1974

1976

1980

PepsiCo Foods International (PFI) yang pada akhirnya berganti

nama menjadi Frito-Lay International, didirikan untuk memasarkan

makanan ringan ke seluruh dunia.

Pepsi-Cola menjadi produksi konsumen Amerika pertama yang

diproduksi, dipasarkan, dan terjual di Uni Soviet.

Pepsi memperkenalkan kampanye pemasaran “Pepsi Challenge

(Tantangan Pepsi)” pertama kali di Dallas, Texas tahun 1975, yang

kemudian menjadi kampanye pemasaran nasional. PepsiCo

membuat ujian rasa buta antara Pepsi-Cola dan pesaingnya,

Coca-Cola. Dalam ujian rasa buta itu, kebanyakan dari konsumen

memilih Pepsi sebagai minuman yang lebih enak.

PepsiCo mengadopsi Kode Pergerakan Bisnis Sedunia.

Pepsi-Cola menjadi satu-satunya merk minuman ringan dengan

penjualan terbesar di supermarket-supermarket di Amerika Serikat.

Dengan kampanye pemasaran “Have a Pepsi day!“ “Puppies,” yang

kemudian menjadi salah satu adpertensi/iklan yang paling disukai di

Amerika.

PepsiCo Food Service International (PFSI) dibentuk dengan fokus

pada perkembangan restoran-restoran ke luar negeri.

(31)

1984

Penampilan pertama Penghargaan Internasional Donald M. Kendall

Bottler-of-the-Year.

Frito-Lay mulai memasarkan kue merk Grandma’s keseluruh dalam

negeri.

Penata taman, Russel Page (1906-1985) mulai memperluas wilayah

taman di PepsiCo.

Pepsi menjadi penjualan #1 di toko-toko.

PepsiCo distruktur ulang untuk lebih fokus kepada tiga pokok

bisnis: minuman ringan, makanan ringan dan restoran. Bisnis

alat-alat transportasi dan olahraga telah terjual.

Wayne Calloway menjadi presiden PepsiCo.

Diet Pepsi di formulasi ulang dengan 100% NutraSweet.

Diperkenalkan Slice and Diet Slice, minuman ringan pertama

dengan jus buah.

Pepsi-Cola membuat sejarah iklan dengan Michael Jackson

bersaudara sebagai gambaran generasi baru Pepsi-Cola, yang mana

iklan tersebut menjadi televisi komersial sekaligus pemasaran

musik yang paling ditunggu-tunggu. Pepsi menjadi “The Choice of

a New Generation (Pilihan Generasi Baru)”.

Herman W. Lay Award of Excellence menetapkan Frito-Lay sebagai

(32)

1990

1995

Saham PepsiCo terpecah menjadi tiga-untuk-satu.

PepsiCo, dengan saham-sahamnya, memegang kedudukan yang

berkuasa dalam perusahaan Gamesa, perusahaan kue terbesar di

Meksiko.

Frito-Lay mengiklankan keripik tortilla merk Doritos bersama

dengan selebritis Jay Leno.

PepsiCo menandatangani perjanjian dagang komersial terbesar

dalam sejarahnya dengan Uni Soviet.

PepsiCo memperoleh keuntungan melebihi 1 miliar dolar untuk

pertama kalinya.

Pepsi-Cola memperkenalkan tema “Nothing else is a Pepsi.”

Pepsi-Cola menjadi adpertensi paling teratas di Super Bowl.

Mountain Dew mensponsori Grammy Awards. Dengan tema “Been

There, Done That, Tried That.

Perkongsian Pepsi Lipton Tea meluncurkan kampanye periklanan

baru yaitu “There’s only one Original.”

Pepsi-Cola memperkenalkan Smooth Moos Smoothies, susu kocok

rendah lemak.

7Up International meluncurkan 7Up Ice Cola, sebuah minuman

kola jernih terbaru.

Frito-Lay memperluas segmen makanan ringan rendah/tanpa-lemak

(33)

1997

2000

PepsiCo memperkenalkan keripik kentang merk Lay’s di 20 market

diseluruh dunia.

Lahirnya situs PepsiCo - http://www.pepsico.com.

Pepsi-Cola mengenalkan kampanye iklan baru dengan tema

Generation Next.”

Air mineral kemasan Aquafina dipasarkan keseluruh dalam negeri.

Frito-Lay mengumumkan rencana pembelian makanan ringan

berusia 104 tahun, yaitu Cracker Jack, yang terbuat dari campuran

jagung berondong dan kacang yang dilapisi permen dari Borden

Foods Corp.

Pepsi-Cola merayakan Hari Jadi ke-100 tahun pada tahun 1998

dengan mengadakan konferensi pengusaha minuman ringan, yang

dilaksanakan di Hawai. Perayaan tersebut juga sekaligus konferensi

pengusaha minuman ringan yang pertama.

Frito-Lay mengenalkan Keripik Tortilla 3D Doritos, yaitu keripik

dengan bentuk segitiga.

Pepsi-Cola membangkitkan kembali kampanye pemasaran “Pepsi

Challenge (Tantangan Pepsi)”. Tantangan tersebut meliputi

minuman kola reguler Pepsi One dan Diet Coke.

Pepsi-Cola bekerjasama dengan Yahoo Inc., sebuah perusahaan

(34)

yang ditujukan kepada remaja dan dewasa muda.

Tropicana, berkongsi dengan Galaxy Foods Co., mengenalkan

minuman susu kedelai dingin-dan-minuman buah, terbuat dari jus,

sup buah kental dicampur dengan susu kedelai dan protein kedelai.

Merk air minum kemasan Aquafina menjadi merk penjualan terbaik

air minum kemasan satu-satunya di saluran dagang eceran di

Amerika Serikat.

PepsiStuff.com, sebuah situs jaringan untuk barang dagangan,

diskon, dan berkas musik digital dari nama-nama terkemuka dalam

bidang perfilman, musik, video game, pakaian, dan olahraga

diluncurkan dalam promosi bersama dengan Yahoo.

Pepsi-Cola meluncurkan “Sierra Mist”, minuman soda lemon, tanpa

kafein.

The North American Coffee Partnership meluncurkan minuman

kopi kemasan Frappucino dengan perencah Karamel, yang

merupakan tambahan perencah keenam bagi minuman kopi praktis

populer tersebut.

PepsiCo, Inc. mencapai kesepakatan untuk mendapatkan saham di

Perusahaan South Beach Beverage, yang merk inovatif SoBe-nya

telah menjadikan perusahaan tersebut sebagai salah satu perusahaan

industri tersukses.

PepsiCo, Inc. dan Perusahaan Quaker Oats mencapai kesepakatan

(35)

PepsiCo melengkapi akuisisi mayoritas saham di South Beverage

Co.

Penjualan PepsiCo mencapai 20 miliar dolar dan telah

mempekerjakan 125.000 (seratus dua puluh lima ribu) pegawai

pada akhir tahun.

PepsiCo meluncurkan Diversity@work, situs jaringan

http://www.pepsico.com/diversity.

2.1.2 Visi dan Misi Perusahaan

2.1.2.1 Visi Perusahaan

“Put into action through programs and a focus on environmental

stewardship, activities to benefit society, and a commitment to build

shareholder value by making a truly sustainable company.”

Visi perusahaan terwujud dalam tindakan melalui

program-program dan suatu fokus pada masalah lingkungan, kegiatan-kegiatan

yang bermanfaat bagi masyarakat, dan sebuah komitmen untuk

membangun nilai bagi saham dengan menjadi perusahaan yang

benar-benar tak tergoyahkan.

2.1.2.2 Misi Perusahaan

Misi PT. Pepsi Cola adalah untuk menjadi perusahaan

produk-produk konsumen terdepan yang tepat terfokus pada produk-produk minuman dan

(36)

investor sebagaimana perusahaan memberikan kesempatan bagi para

pegawai, rekan bisnis, dan komunitas tempat PT. Pepsi Cola berusaha

untuk berkembang dan memperkaya diri. Dan dalam segala hal yang

dikerjakan, perusahaan berjuang demi kejujuran, keadilan, dan integritas.

2.1.3 Struktur Organisasi Perusahaan

Secara garis besar, PT. Pepsi Cola Indobeverages dipimpin oleh

seorang Presiden Direktur sebagai pimpinan tertinggi perusahaan yang

dibantu oleh beberapa orang yang menempati posisi sebagai direktur pada

struktur inti dari perusahaan. Sedangkan dalam hal produksi, PT. Pepsi

Cola dipimpin oleh seorang Plant Manager yang bertanggung jawab

langsung kepada Presiden Direktur. Plant Manager ini bertugas sebagai

pimpinan tertinggi di bagian produksi (pabrik). Seperti halnya pimpinan

secara umum, Plant Manager juga dibantu oleh para Manager lainnya

sebagai bawahan yang masing-masing bertanggung jawab atas

bagian/departemen yang mereka pimpin. Untuk lebih jelas mengenai

struktur organisasi PT. Pepsi Cola Indobeverages dapat dilihat pada

(37)

Gambar 2.1 Struktur Organisasi Perusahaan

2.2Landasan Teori

2.2.1Pengertian Data Mining

Data Mining (DM) adalah salah satu bidang yang berkembang

pesat karena besarnya kebutuhan akan nilai tambah dari database skala

besar yang makin banyak terakumulasi sejalan dengan pertumbuhan

teknologi informasi. Definisi umum dari DM itu sendiri adalah

serangkaian proses untuk menggali nilai tambah berupa pengetahuan

yang selama ini tidak diketahui secara manual dari suatu kumpulan

data.[5]

Data mining adalah kombinasi secara logis antara pengetahuan

data, dan analisa statistik yang dikembangkan dalam pengetahuan bisnis

atau suatu proses yang menggunakan teknik statistik, matematika,

kecerdasan buatan, tiruan dan machine-learning untuk mengekstraksi

dan mengidentifikasi informasi yang bermanfaat bagi pengetahuan yang

(38)

Data mining meliputi tugas-tugas yang dikenal sebagai ekstraksi

pengetahuan, arkeologi data, eksplorasi dalam pemrosesan pola data dan

memanen informasi. Semua aktifitas ini dilakukan secara otomatis dan

mengizinkan adanya penemuan cepat bahkan oleh non programmer. [7]

Data mining cerdas menemukan informasi di dalam data

warehouse dimana laporan dan query tidak bisa diungkapkan secara

efektif. Piranti data mining menemukan pola-pola di dalam data dan

bahkan menyimpulkan aturan dari data tersebut.[7]

Data mining (DM) yang juga dikenal sebagai Knowledge

Discovery (Frawley et al., 1992), merupakan salah satu bidang yang

berkembang pesat karena besarnya kebutuhan akan nilai tambah dari

database skala besar yang makin banyak terakumulasi sejalan dengan

pertumbuhan teknologi informasi. Secara umum, data mining dapat

didefinisikan sebagai suatu rangkaian proses untuk menggali nilai

tambah berupa ilmu pengetahuan yang selama ini tidak diketahui secara

manual dari suatu kumpulan data.[1]

Definisi umum dari Data Mining adalah proses pencarian pola-pola

yang menarik (hidden pattern) berupa pengetahuan (knowledge) yang

tidak diketahui sebelumnya dari suatu kumpulan data dimana data

tersebut dapat berada dalam database, data warehouse, atau media

penyimpanan informasi yang lain. Data Mining merupakan proses

(39)

tersembunyi pada sejumlah besar data yang disimpan ketika

menjalankan bisnis perusahaan.

2.2.2Tahapan Data Mining

Dalam aplikasinya, data mining sebenarnya merupakan bagian dari

proses Knowledge Discovery in Database (KDD), bukan sebagai

teknologi yang utuh dan berdiri sendiri. Data mining merupakan suatu

bagian langkah yang penting dalam proses KDD terutama berkaitan

dengan ekstraksi dan penghitungan pola-pola dari data yang ditelaah,

seperti ditunjukan oleh gambar 2.2 dibawah ini :[5]

(40)

a. Data cleaning

Untuk menghilangkan data noise (data yang tidak

relevan/berhubungan langsung dengan tujuan akhir proses data

mining, misal: data mining yang bertujuan untuk menganalisa hasil

penjualan, maka data-data dalam kumpulan seperti ”nama pegawai”,

”umur”, dan sebagainya dapat di-ignore) dan tidak konsisten.

b. Data integration

Untuk menggabungkan multiple data source.

c. Data selection

Untuk mengambil data yang sesuai untuk keperluan analisa.

d. Data transformation

Untuk mentransformasikan data ke dalam bentuk yang lebih

sesuai untuk di mining.

e. Data mining

Proses terpenting dimana metode tertentu diterapkan untuk

menghasilkan data pattern.

f. Pattern evaluation

Untuk mengidentifikasi apakah interenting patterns yang

didapatkan sudah cukup mewakili knowledge berdasarkan

perhitungan tertentu.

g. Knowledge presentation

Untuk mempresentasikan knowledge yang sudah didapatkan dari

(41)

2.2.3Arsitektur Data Mining

Umumnya system data mining terdiri dari komponen-komponen

berikut:

a. Database, data warehouse, atau media penyimpanan informasi

Media dalam hal ini bisa jadi berupa database, data warehouse,

spreadsheets, atau jenis-jenis penampung informasi lainnya. Data

cleaning dan data intregration dapat dilakukan pada datadata

tersebut.

b. Database atau data warehouse server

Database atau data warehouse server bertanggung jawab untuk

menyediakan data yang relevan berdasarkan permintaan dari user

pengguna data mining.

c. Basis Pengetahuan (knowledge base)

Merupakan basis pengetahuan yang digunakan sebagai panduan

dalam pencarian pola.

d. Data mining engine

Yaitu bagian dari software yang menjalankan program berdasarkan

algoritma yang ada.

e. Pattern evaluation module

Yaitu bagian dari software yang berfungsi untuk menemukan

pattern atau pola-pola yang terdapat di dalam database yang diolah

sehingga nantinya proses datamining dapat menemukan knowledge

(42)

f. Graphical user interface

Bagian ini merupakan sarana antara user dan sistem data mining

untuk berkomunikasi, dimana user dapat berinteraksi dengan sistem

melalui data mining query, untuk menyediakan informasi yang dapat

membantu dalam pencarian knowledge. Lebih jauh lagi, bagian ini

mengijinkan user untuk melakukan browsing pada database dan data

warehouse, mengevaluasi pattern yang telah dihasilkan, dan

menampilkan pattern tersebut dengan tampilan yang berbeda-beda.[3]

Gambar 2.3 Arsitektur Data Mining

2.2.4Pengelompokan(Clustering)

Pengelompokan (clustering) merupakan tugas deskripsi yang

banyak digunakan dalam mengidentifikasi sebuah himpunan terbatas

pada kategori atau cluster untuk mendeskripsikan data yang ditelaah.

Kategori-kategori ini dapatbersifat eksklusif dan ekshaustifmutual, atau Graphical User Interface (GUI)

Pattern Evaluation

Data Mining Engine

Database or Data Warehouse Server

Database Data

Warehouse

Data Cleaning & Data integration Filtering

(43)

mengandung representasiyang lebih kaya seperti kategoriyang hirarkis

atau saling menumpu (overlapping).

Berbeda dengan association rule mining dan classification dimana

kelas data telah ditentukan sebelumnya, clustering melakukan

pengelompokan data tanpa berdasarkan kelas data tertentu. Bahkan

clustering dapat dipakai untuk memberikan label pada kelas data yang

belum diketahui itu. Karena itu clustering sering digolongkan sebagai

metode unsupervised learning.

Prinsip dari clustering adalah memaksimalkan kesamaan antar

anggota satu kelas dan meminimumkan kesamaan antar kelas/cluster.

Clustering dapat dilakukan pada data yang memiliki beberapa atribut

yang dipetakan sebagai ruang multidimensi. Ilustrasi dari clustering

dapat dilihat pada Gambar 2.3 dimana lokasi, dinyatakan dengan bidang

dua dimensi, dari pelanggan suatu toko dapat dikelompokkan menjadi

beberapa cluster dengan pusat cluster ditunjukkan oleh tanda positif (+).

Banyak algoritma clustering memerlukan fungsi jarak untuk

mengukur kemiripan antar data, diperlukan juga metode untuk

normalisasi bermacam atribut yang dimiliki data.

Beberapa kategori algoritma clustering yang banyak dikenal adalah

metode partisi dimana pemakai harus menentukan jumlah k partisi yang

diinginkan lalu setiap data di tes untuk dimasukkan pada salah satu

partisi, metode lain yang telah lama dikenal adalah metode hierarki yang

(44)

cluster lebih besar dan top-down yang memecah cluster besar menjadi

cluster yang lebih kecil. Kelemahan metode ini adalah bila salah satu

penggabungan/pemecahan dilakukan pada tempat yang salah, tidak

dapat didapatkan cluster yang optimal. Pendekatan yang banyak diambil

adalah menggabungkan metode hierarki dengan metode clustering

lainnya seperti yang dilakukan oleh Chameleon.[6]

Gambar 2.4 Ilustrasi Clustering

(45)

Ada beberapa teknik dalam clustering, yaitu :

1. Metode partisi : membangun berbagai partisi dan kemudian

mengevaluasi partisi tersebut dengan beberapa kriteria.

2. Metode hierarki : membuat suatu penguraian secara hierarkikal dari

himpunan data menggunakan beberapa kriteria.

3. Metode Berbasis densitas : berdasarkan konektivitas dan fungsi

densitas.

4. Metode Berbasis grid : berdasarkan suatu struktur granularitas

multi-level.

5. Metode Berbasis model : suatu model dihipotesakan untuk masing –

masing cluster dan ide untuk mencari best fit dari model tersebut

untuk masing – masing yang lain.

2.2.4.1Teknik Clustering

Secara garis besar metode clustering dibagi dalam 2 tipe yaitu :

hierarchical dan non hierarchical. Hierarchical menggunakan N x N

similarity matrix, sedangkan non hierarchical membagi dataset menjadi

sebuah level single partisi, dengan atau tanpa pencocokan antara

clusters. Selain itu hal mendasar yang membedakan kedua metode ini

adalah : metode pengelompokan hirarki digunakan apabila belum ada

informasi jumlah kelompok, sedangkan metode pengelompokan non

hirarki bertujuan mengelompokan n objek ke dalam k kelompok (k<n).

Berikut adalah perjelasan singkat mengenai perbandingan antarametode

(46)

2.2.4.2HierarchicalClustering

Teknik hirarki(hierarchical methods) adalah teknik clustering yang

membentuk kontruksi hirarki berdasarkan tingkatan tertentu seperti

struktur pohon Dengandemikian proses pengelompokkannya dilakukan

secara bertingkat atau bertahap. Hasil dari pengelompokan ini dapat

disajikan dalam bentuk dendogram. Ada dua pendekatan dalam

hierarchical clustering yaitu agglomerative dan divisive. Berikut ini

adalah gambaran mengenai Agglomerative dan Divisive :

Gambar 2.6 Agglomerative dan Divisive

2.2.4.3Agglomerative

Metode ini dimulai dengan setiap N cluster membentuk cluster

masing-masing. Kemudian dua cluster dengan jarak terdekat

bergabung. Selanjutnya cluster yang lama akan bergabung dengan

cluster yang sudah ada dan membentuk cluster baru. Hal ini tetap

memperhitungkan jarak kedekatan antar cluster. Proses akan berlanjut

hingga akhirnya terbentuk satu cluster yang terdiri dari keseluruhan

(47)

Beberapa metode dari agglomerative :

1. Single linkage (nearest neighbor methods) : Metode ini

menggunakan prinsip jarak minimum yang diawali dengan

mencari dua cluster terdekat dan keduanya membentuk

cluster yang pertama.

2. Complete linkage (furthest neighbor methods) : Metode ini

merupakan kebalikan dari pendekatan yang digunakan pada

single linkage. Prinsip jarak yang digunakan adalah jarak

terjauh(maksimal) antar cluster.

3. Average linkage between groups methods : Metode ini

mengikuti prosedur yang sama dengan kedua metode

sebelumnya. Prinsip ukuran jarak yang digunakan adalah

jarak rata-rata antar tiap pasangan cluster yang mungkin.

4. Ward’s method error sum of squares : Ward mengajukan

suatu metode pembentukan cluster yang didasari oleh

hilangnya informasi akibat penggabungan cluster menjadi

cluster. Hal ini diukur dengan jumlah total deviasi kuadrat

dari meancluster untuk tiap observasi.

2.2.4.4Divisive

Metode divisive berlawanan dengan metode agglomerative.

Metode ini pertama-tama diawali dengan satu cluster besar yang

mencakup semua cluster. Selanjutnya cluster yang memiliki

(48)

cluster yang lebih kecil. Pemisahan ini dilanjutkan sehingga mencapai

sejumlah cluster yang diinginkan.

2.2.4.5PartitionalClustering

Konsep dasar dari partitional clustering adalah membagi n jumlah

cluster kedalam k cluster. Metode ini merupakan metode

pengelompokan yang bertujuan mengelompokan objek sehingga jarak

antar tiap objek ke pusat kelompok didalam satu kelompok adalah

minimum. K-means Clustering dan K-medoids atau PAM (partition

around medoids)merupakan beberapa algoritma dari partitional

clustering. Berikut ini adalah penjelasan singkat dari metode clustering

K-means yaitu :

a. Membagi objek ke dalam k subset tak kosong.

b. Menghitung titik benih sebagai pusat(titik rata – rata dari cluster)

cluster dari partisi sekarang.

c. Memberikan masing – masing objek tersebut ke cluster dengan

titik benih terdekat.

d. Kembali ke tahap yang kedua, berhenti jika tidak ada lagi yang

penugasan baru.

2.2.4.6Agglomerative Hierarchical Clustering Algorithm(AHC

algorithm)

Proses Clustering yang akan dilakukan menggunakan

Agglomerative Hierarchical Clustering Algorithm (AHC algorithm).

(49)

hierarchical clustering lebih baik dibandingkan kmeans yang sering

digunakan, karena lebih efisien . Proses dasar dari hierarchical

clustering adalah:

a. Mulailah dengan mendefinisikan setiap item sebagai cluster, jadi

data yang ada sejumlah N items, maka sekarang cluster yang ada

sejumlah N items tersebut. Jarak antara clusters sama dengan jarak

antara items yang ada.

b. Selanjutnya, mencari pasangan cluster yang paling dekat dan

menggabungkan keduanya dalam satu cluster.

c. Hitung jarak antara cluster yang baru dibentuk dengan cluster yang

sudah ada sebelumnya. Ulangi tahap b dan c sampai cluster

membentuk N cluster yang diinginkan.

Ada tiga metode yang ada dalam AHC algorithm dan yang akan

digunakan untuk melakukan clustering adalah metode single linkage.

Metode single lingkage menggunakan prinsip jarak minimum. Dibawah

ini adalah psedeocode dari algoritma Agglomerative Hierarchical

Clustering.

Agglomerative Hierarchical Algorithm:

Given:

a set X of objects {x1,...,xn} a distance function dis(c1,c2)

1. for i = 1 to n ci = {xi}

end for

2. C = {c1,...,cb} 3. l = n+1 4. while C.size > 1 do

(50)

b) remove cmin1 and cmin2 from C

c) add {cmin1,cmin2} to C

d) l = l + 1

end while

Contoh : diberikan kumpulan X(dapat dilihat pada gambar ), yang sudah

direpresentasikan dalam bentuk matrix. Dengan menggunakan fungsi

Euclidean distance dan single link method untuk menghitung jarak

antara clusters.

a. pertama, masing – masing anggota (Xi) dari X, ditempatkan dalam

cluster Ci,dimana Ci adalah anggota dari cluster C.

C = {{x1},{x2},{x3}, {x4},{x5},{x6},{x7}, {x8},{x9},{x10}}

b. set l = 11.

c. (iterasi pertama dari penggulangan menggunakan while) C.size =

10. Setelah dilakukan perhitungan jarak maka didapatkan jarak

minimum adalah hasil perhitungan jarak antara C2 dan C10.

(cmin1,cmin2) = (c2,c10)

Pindahkan c2 and c10 from C, tambahkan c11 to C.

C = {{x1},{x3}, {x4},{x5},{x6},{x7}, {x8},{x9},{{x2}, {x10}}}

(51)

d. Dan perhitungan terus dilakukan sampai membentuk N cluster yang

diinginkan.

e. Kesimpulan dari hasil clustering yang didapatkan.

Tahapan akhir dari proses clustering adalah kesimpulan dari clustering

yang didapatkan.

2.2.4.7Contoh Penerapan Clustering Menggunakan Algoritma AHC

Dari hasil penelitian yang dilakukan, didapatkan sample data

penjualan produk minuman dari suatu perusahaan. Dari data penjualan

tersebut akan dicoba dilakukan pengelompokan (clustering)

menggunakan algoritma AHC. Adapun data penjualan tersebut dapat

dilihat pada Tabel 2.1 dibawah.

Tabel 2.1 Data Penjualan Minuman Per Wilayah Tanggal 1 Januari 2007

WILAYAH JUMLAH

Bandar Lampung 9803

Bandung 27281

Batam 7488

Bogor 10864

Denpasar 6839

Depok 16291

Jakarta Barat 12653

Jakarta Pusat 11035

Jakarta Selatan 5937

Jakarta Timur 14843

Jakarta Utara 8787

(52)

Sesuai dengan algoritma yang diterapkan, maka setiap item wilayah pada

table diatas akan dijadikan sebagai cluster, jadi data yang ada sejumlah

18 items, maka sekarang cluster yang ada sejumlah 18 items tersebut.

Selanjutnya, dari data penjualan (jumlah) dicari pasangan cluster yang

paling dekat (selisih terkecil) dan menggabungkan keduanya dalam satu

cluster. Pembuatan cluster pertama ini dapat dilihat pada Tabel 2.2

berikut :

Tabel 2.2 Pembuatan cluster pertama

WILAYAH JUMLAH

Jakarta Timur 14843

KELOMPOK : A5 | JUMLAH ANGGOTA : 1

Jakarta Barat 12653

KELOMPOK : A6 | JUMLAH ANGGOTA : 1

Jakarta Pusat 11035

KELOMPOK : A7 | JUMLAH ANGGOTA : 1

Bogor 10864

KELOMPOK : A8 | JUMLAH ANGGOTA : 1

Bandar Lampung 9803

KELOMPOK : A9 | JUMLAH ANGGOTA : 1

Malang 9360

KELOMPOK : A10 | JUMLAH ANGGOTA : 2

Jakarta Utara 8787

Pakanbaru 8808

Jakarta Selatan 5937

KELOMPOK : A17 | JUMLAH ANGGOTA : 1

(53)

Dari tabel diatas dapat terlihat bahwa pasangan cluster yang paling dekat

yang pertama kali membentuk cluster adalah wilayah Jakarta Utara dan

Pekanbaru yang merupakan anggota kelompok A10. Sedangkan wilayah

lainnya masih merupakan cluster dari dirinya sendiri. Setelah jarak

terdekat membentuk satu cluster pertama, kemudian kita harus

menghitung jarak antara cluster yang baru dibentuk dengan cluster yang

sudah ada sebelumnya. Tahap ini akan diulangi sampai cluster

membentuk N cluster yang diinginkan. Dalam kasus ini, misalnya kita

akan membentuk tiga cluster dari data yang ada, maka hasil dari

algoritma AHC yang digunakan adalah seperti terlihat pada Tabel 2.3

berikut :

Tabel 2.3 Hasil clustering sebanyak tiga cluster

WILAYAH JUMLAH

KELOMPOK : A1 | JUMLAH ANGGOTA : 1

Bandung 27281

KELOMPOK : A2 | JUMLAH ANGGOTA : 10

Jakarta Utara 8787

Pakanbaru 8808

Malang 9360

Bandar Lampung 9803

Bogor 10864

Jakarta Pusat 11035

Jakarta Barat 12653

Jakarta Timur 14843

Depok 16291

Tangerang 17461

KELOMPOK : A3 | JUMLAH ANGGOTA : 7

Padang 4980

Jakarta Selatan 5937

Samarinda 6728

Denpasar 6839

Tasikmalaya 7224

Makassar 7277

(54)

2.2.5Konsep Dasar Data dan Informasi

2.2.5.1 Pengertian Data

Menurut Azhar Susanto : “Data adalah fakta atau apapun

yang dapat digunakan input dan menghasilkan informasi”.[6]

Data adalah kenyataan yang menggambarkan suatu kejadiandan

kesatuan kenyataan. Data merupakan suatu istilah yang

berbentuk jamak dari kata “datum” yang berarti fakta atau

bagian dari fakta yang mengandung arti yang menghubungkan

dengan kenyataan, simbol-simbol, gambar-gambar, kata-kata,

angka-angka, huruf-huruf yang menunjukan suatu ide, objek,

kondisi dan situasi.

Menurut the liang gie: ”Data atau bahan keterangan adalah

hal atau peristiwa kenyataan lainnya apapun yang mendukung

suatu pengetahuan untuk dijadikan dasar guna penyusunan

keterangan pembuatan kesimpulan atau penetapan keputusan,

atau data ibarat bahan mentah yang melalui pengolahannya

tertentu lalu menjadi keterangan (informasi)”.

2.2.5.2 Pengertian Informasi

Informasi adalah hasil pengolahan data yang memberikan

(55)

2.2.6Basis Data (Database)

Basis data (Database) adalah sekumpulan informasi bermanfaat

yang diorganisasikan kedalam tata cara yang khusus.[6]

Database adalah kumplan data yang saling berkaitan, berhubungan

yang disimpan secara bersama-sama sedemikian rupa tanpa pengulangan

yang tidak perlu, untuk memenuhi berbagai kebutuhan. Data-data ini

harusmengandung semua informasi untuk mendukung semua kebutuhan

sistem.Proses dasar yang dimiliki oleh database ada empat, yaitu:

1.Pembuatan data-data baru (create database)

2. Penambahan data (insert)

3. Mengubah data (update)

4. Menghapus data (delete).

Database merupakan salah satu komponen yang penting dalam

sistem informasi, karena merupakan basis dalam menyediakan informasi

pada para pengguna. Basis data (database) menjadi penting karena

munculnya beberapa masalah bila tidak menggunakan data yang

terpusat, seperti adanya duplikasi data, hubungan antar data tidak jelas,

organisasi data dan update menjadi rumit. Jadi tujuan dari pengaturan

data dengan menggunakan basis data adalah :

a. Menyediakan penyimpanan data untuk dapat digunakan oleh

organisasi saat sekarang dan masa yang akan datang.

b. Cara pemasukan data sehingga memudahkan tugas operator dan

(56)

mendapatkan data serta hak-hak yang dimiliki terhadap data yang

ditangani.

c. Pengendalian data untuk setiap siklus agar data selalu up-to-date dan

dapat mencerminakan perubahan spesifik yang terjadi di setiap

sistem.

d. Pengamanan data terhadap kemungkinan penambahan, modifikasi,

pencurian dan gangguan-gangguan lain.

Dalam basis data sistem informasi digambarkan dalam model

entity relationship (E-R). Bahasa yang digunakan dalam basis data

(database) yaitu :

a. DDL (Data Definition Language)

Merupakan bahasa definisi data yang digunakan untuk membuat dan

mengelola objek database seperti database, tabel dan view

b. DML (Data Manipulation Language)

Merupakan bahasa manipulasi data yang digunakan untuk

memanipulasi data pada objek database seperti tabel

c. DCL (Data Control Language)

Merupakan bahasa yang digunakan untuk mengendalikan

pengaksesan data.

Penyusunan basis data meliputi proses memasukkan data kedalam

media penyimpanan data, dan diatur dengan menggunakan perangkat

(57)

2.2.7DatabaseManagement System (DBMS)

“Managemen Sistem Basis Data (Database Management System /

DBMS) adalah perangkat lunak yang di desain untuk membantu dalam

hal pemeliharaan dan utilitas kumpulan data dalam jumlah besar”.[6]

Sistem Manajemen Basis data (Database Management System)

merupakan sistem pengoperasian dan sejumlah data pada komputer.

Dengan sistem ini dapat merubah data, memperbaiki data yang salah dan

menghapus data yang tidak dapat dipakai. Sistem manajemen database

merupakan suatu perluasan software sebelumnya mengenai software

pada generasi komputer yang pertama. Dalam hal ini data dan informasi

merupakan kesatuan yang saling berhubungan dan berkerja sama yang

terdiri dari: peralatan, tenaga pelaksana dan prosedur data. Sehingga

pengolahan data ini membentuk sistem pengolahan data. Peralatan dalam

hal ini berupa perangakat keras (hardware) yang digunakan, dan

prosedur data yaitu berupa perangakat lunak (software) yang digunakan

dan dipakai untuk mengalokasikan dalam pembuatan sistem informasi

pengolahan database.

Manipulasi basis data meliputi pembuatan pernyataan (query)

untuk mendapatkan informasi tertentu, melakukan pembaharuan atau

penggantian (update) data, serta pembuatan report dari data. Tujuan

utama DBMSadalah untuk menyediakan tinjauan abstrak dari data bagi

user. Jadi sistem menyembunyikan informasi mengenai bagaimana data

(58)

Pertimbangan efisiensi yang digunakan adalah bagaimana merancang

struktur data yang kompleks, tetapi tetap dapat digunakan oleh pengguna

yang masih awam, tanpa mengetahui kompleksitas stuktur data.Sistem

manajemen database atau database management system (DBMS) adalah

merupakan suatu sistem software yang memungkinkan seorang user

dapat mendefinisikan, membuat, dan memelihara serta menyediakan

akses terkontrol terhadap data. Database sendiri adalah sekumpulan data

yang berhubungan dengan secara logika dan memiliki beberapa arti yang

saling berpautan. DBMS yang utuh biasanya terdiri dari :

1. Hardware

Hardware merupakan sistem komputer aktual yang digunakan untuk

menyimpan dan mengakses databse. Dalam sebuah organisasi

berskala besar, hardware terdiri : jaringan dengan sebuah server

pusat dan beberapa program client yang berjalan di komputer

desktop.

2. Software beserta utility Software adalah DBMS yang aktual. DBMS

memungkinkan para user untuk berkomunikasi dengan database.

Dengan kata lain DBMS merupakan mediator antara database

dengan user. Sebuah database harus memuat seluruh data yang

diperlukan oleh sebuah organisasi.

3. Prosedur

Bagian integral dari setiap sistem adalah sekumpulan prosedur yang

(59)

diikuti user untuk mendapatkan, memasukkan, menjaga, dan

mengambil data

4. Data

Data adalah jantung dari DBMS. Ada dua jenis data. Pertama, adalah

kumpulan informasi yang diperlukan oleh suatu organisasi. Jenis

data kedua adalah metadata, yaitu informasi mengenai database.

5. User (Pengguna)

Ada sejumlah user yang dapat mengakses atau mengambil data

sesuai dengan kebutuhan penggunaan aplikasi-aplikasi dan interface

yang disediakan oleh DBMS, antara lain adalah :

a. Database administrator adalah orang atau group yang

bertanggungjawab mengimplementasikan sistem database di

dalam suatu organisasi.

b. Enduser adalah orang yang berada di depan workstation dan

berinteraksi secara langsung dengan sistem.

c. Programmer aplikasi, orang yang berinteraksi dengan database

melalui cara yang berbeda.

2.2.8ERD(Entity Relationship Diagram)

Basis data Relasional adalah kumpulan dari relasi-relasi yang

mengandung seluruh informasi berkenaan suatu entitas/ objek yang akan

disimpan di dalam database. Tiap relasi disimpan sebagai sebuah file

tersendiri. Perancangan basis data merupakan suatu kegiaatan yang

(60)

a. Menghilangkan redundansi data.

b. Meminimumkan jumlah relasi di dalam basis data.

c. Membuat relasi berada dalam bentuk normal, sehingga dapat

meminimumkan permasalahan berkenaan dengan penambahan,

pembaharuan dan penghapusan.

ERD adalah suatu pemodelan dari basis data relasional yang

didasarkan atas persepsi di dalam dunia nyata, dunia ini senantiasa

terdiri dari sekumpulan objek yang saling berhubungan antara satu

dengan yang lainnya. Suatu objek disebut entity dan hubungan yang

dimilikinya disebut relationship. Suatu entity bersifat unik dan memiliki

atribut sebagai pembeda dengan entity lainnya.

Contoh : entity Mahasiswa, mempunyai atribut nama, umur, alamat, dan

nim.

Diagram E-R terdiri dari:

a. Kotak persegi panjang, menggambarkan himpunan entitas.

b. Elips, menggambarkan atribut-atribut entitas.

c. Diamon, menggambarkan hubungan antara himpunan entitas

d. Garis, yang menghubungkan antar objek dalam diagram E-R

E-R Diagram merupakan suatu bahasa pemodelan dimana

posisinya dapat dianalogikan dengan story board dalam industri film,

blue print arsitektur suatu bangunan, miniatur, dan lain-lain. Dalam

praktiknya, membangun suatu sistem terlebih dahulu dilakukannya suatu

(61)

secara keseluruhan sebagai salah satu upaya feedback evaluasi

perampungan suatu perencanaan. E-R Diagram sebagai suatu pemodelan

setidaknya memiliki beberapa karakteristik dan manfaat sebagai berikut:

a. Memudahkan untuk dilakukannya analisis dan perubahan sistem

sejak dini, bersifat murah dan cepat

b. Memberikan gambaran umum akan sistem yang akan di buat

sehingga memudahkan developer.

c. Menghasilkan dokumentasi yang baik untuk client sebagai bahan

diskusi dengan bentuk E-R Diagram itu sendiri, dan

d. Kamus data bagi bagi para pengembang database.

Struktur dari E-R Diagram secara umum ialah terdiri dari:

a. Entitas merupakan objek utama yang informasi akan disimpan,

biasanya berupa kata benda, ex; Mahasiswa, Dosen, Nasabah, Mata

Kuliah, Ruangan, dan lain-lain. Objek dapat berupa benda nyata

maupun abstrak.

b. Atribut merupakan deskripsi dari objek yang bersangkutan

c. Relationship merupakan suatu hubungan yang terjalin antara dua

entitas yang ada.

Kardinalitas Relasi ERD yang mempersentasikan suatu basis data

relasional senantiasa memiliki relasi-relasi dari sejumlah entitas yang

dapat ditentukan banyaknya. Banyaknya suatu relasi yang dimiliki oleh

suatu relasi entitas disebut derajat relasi. Derajat relasi maksimum

(62)

modalitas. Kardinalitas yang terjadi diantara dua himpunan entitas (misal

A dan B) dapat berupa :

a. One to One, satu record dipetakan dengan satu record di entitas

lain. Contoh: satu nasabah punya satu account.

b. One to Many, Satu record dapat dipetakan menjadi beberapa

record di entitas lain. Contoh: satu nasabah dapat punya lebih dari

satu account.

c. Many to Many, Beberapa record dapat dipetakan menjadi beberapa

record di entitas lain. Contoh: satu nasabah dapat memiliki lebih

dari satu account. Satu account dapat dimiliki lebih dari satu

nasabah (join account).

2.2.9DFD(Data Flow Diagram)

DFD adalah suatu model logika data atau proses yang dibuat untuk

menggambarkan dari mana asal data dan kemana tujuan data yang keluar

dari sistem, dimana data disimpan, proses apa yang menghasilkan data

tersebut dan interaksi antara data yang tersimpan dan proses yang

dikenakan pada data tersebut.

DFD sering digunakan untuk menggambarkan suatu sistem yang

telah ada atau sistem baru yang akan dikembangkan secara logika tanpa

mempertimbangkan lingkungan fisik dimana data tersebut mengalir atau

Gambar

Gambar 2.2 Tahapan pada proses knowledge discovery
Gambar 2.3 Arsitektur Data Mining
Gambar 2.5 Pengelompokan himpunan data menjadi tiga  cluster
Tabel 2.1 Data Penjualan Minuman Per Wilayah Tanggal 1 Januari 2007
+7

Referensi

Dokumen terkait

Untuk Data Penjualan Produk Coca-Cola pada PT Coca-Cola Bottling Indonesia Medan Berdasarkan Krat Periode Januari 2002 sampai Desember 2006, nilai ini ditunjukkan pada tabel

[r]

Tahap implementasi sistem merupakan tahap untuk mengaplikasikan apa yang telah dirancang pada tahap perancangan sistem berdasarkan hasil analisis sistem. Implementasi

Weka , seorang manajer dapat mengambil suatu kutupusan yang dilakukan untuk menentukan strategi penjualan yang ada di Toko Buku Gramedia Palembang, karena

Pengertian dari K-means clustering adalah, K dimaksudkan sebagai konstanta jumlah cluster yang diinginkan, Means dalam hal ini berarti nilai suatu rata-rata dari suatu

Sedangkan barang-barang yang memiliki nilai confidence tinggi diletakkan bersebelahan karena dengan tingginya nilai confidence antar kedua barang atau lebih memiliki

Melakukan tinjau lansung ke perusahaan tersebut mengenai proses penjualan bahan bakar pada perusahaan tersebut dengan adanya pengolahan dengan cara mengclusterkan

KESIMPULAN Sehingga dari hasil penelitian dapat disimpulkan bahwa Metode K-means dapat diterapkan pada toko Myam Hijab untuk menentukan penjualan baju mana yang sangat laris, laris dan