PENERAPAN DATA MINING PADA PENJUALAN PRODUK
MINUMAN DI PT. PEPSI COLA INDOBEVERAGES
MENGGUNAKAN METODE CLUSTERING
SKRIPSI
Diajukan untuk Menempuh Ujian Akhir Sarjana Program Strata Satu Jurusan Teknik Informatika
Fakultas Teknik dan Ilmu Komputer Universitas Komputer Indonesia
Oleh :
ENUR IRDIANSYAH
10105140
JURUSAN TEKNIK INFORMATIKA
FAKULTAS TEKNIK DAN ILMU KOMPUTER
UNIVERSITAS KOMPUTER INDONESIA
BANDUNG
PENERAPAN DATA MINING PADA PENJUALAN PRODUK
MINUMAN DI PT. PEPSI COLA INDOBEVERAGES
MENGGUNAKAN METODE CLUSTERING
ENUR IRDIANSYAH
10105140
Pembimbing,
Andri Heryandi, S.T., M.T. NIP. 41277006007
Menyetujui,
Ketua Jurusan Teknik Informatika
PENERAPAN DATA MINING PADA PENJUALAN PRODUK
MINUMAN DI PT. PEPSI COLA INDOBEVERAGES
MENGGUNAKAN METODE CLUSTERING
ENUR IRDIANSYAH
10105140
Penguji I Penguji II
Irfan Maliki, S.T. Andri Heryandi, S.T., M.T.
NIP. 41277006019 NIP. 41277006007
Penguji III
i
ABSTRAK
PENERAPAN
DATA MINING
PADA PENJUALAN PRODUK
MINUMAN DI PT. PEPSI COLA INDOBEVERAGES
MENGGUNAKAN METODE
CLUSTERING
Oleh
Enur Irdiansyah
10105140
Dalam dunia bisnis yang selalu dinamis dan penuh persaingan, para pelakunya harus senantiasa memikirkan cara-cara untuk terus survive dan jika mungkin mengembangkan skala bisnis mereka.
PT. Pepsi Cola Indobeverages merupakan perusahaan yang bergerak dalam bidang industri minuman. Sebagai perusahaan besar, PT. Pepsi Cola Indobeverages menghasilkan berbagai macam produk minuman dengan nama dan kemasan yang berbeda. Tidak hanya PT. Pepsi Cola Indobeverages, masih cukup banyak perusahaan-perusahaan lain yang bergerak dibidang serupa. Hal tersebut tentu saja menimbulkan persaingan bisnis antarperusahaan.
Dalam rangka menghadapi persaingan bisnis dan meningkatkan pendapatan perusahaan, pihak terkait dalam perusahaan tersebut dituntut untuk dapat mengambil keputusan yang tepat dalam menentukan strategi pemasaran produk minuman yang akan dijualnya.
Ketersediaan data yang melimpah, kebutuhan akan informasi (atau pengetahuan) sebagai pendukung pengambilan keputusan untuk membuat solusi bisnis, dan dukungan infrastruktur di bidang teknologi informasi merupakan cikal-bakal dari lahirnya teknologi data mining. Data mining dimaksudkan untuk memberikan solusi nyata bagi para pengambil keputusan di dunia bisnis, untuk mengembangkan bisnis mereka.
Data mining didefinisikan sebagai satu set teknik yang digunakan secara otomatis untuk mengeksplorasi secara menyeluruh dan membawa ke permukaan relasi-relasi yang kompleks pada set data yang sangat besar. Salah satu metode yang terdapat dalam data mining yang digunakan dalam penelitian ini adalah pengelompokan (Clustering) dimana metode tersebut mengidentifikasi objek yang memiliki kesamaan karakteristik tertentu, dan kemudian menggunakan karakteristik tersebut sebagai “vektor karakteristik” atau “centroid”.
Hasil dari penelitian ini adalah aplikasi yang dapat mempermudah menganalisis sejumlah data yang besar guna membantu memberikan informasi berharga sebagai gambaran dasar pengambilan keputusan perusahaan.
ii
ABSTRACT
DATA MINING APPLICATION OF BEVERAGE PRODUCTS
MARKETING IN PEPSI COLA INDOBEVERAGES COMPANY
USING CLUSTERING METHOD
By
Enur Irdiansyah
10105140
In the dynamic and very competitive world of commerce or business, the people involved have to be fully prepared of the ways to surviving and developing their business range.
Pepsi Cola Indobeverages Company is a consumer products company focused on beverages. As a big company, Pepsi Cola Indobeverages Company seeks to produce various beverage products with different names and packages. Pepsi Cola Indobeverages Company is not the only one company that focused on beverages in Indonesia, there are several companies with similar direction. It is surely arising business competitions among the companies.
To be up against the business competitions and to improve company financial rewards, the company must have an ability to take the appropriate decision of definitive marketing strategies of their beverage products.
The availability of abundant data, the necessity of information (or knowledge) as the proponent to take the appropriate decision of establishing business solutions, and the infrastructure supports in information technology are the pioneers of data mining technology. Data mining purpose is to give the real solution for the decision maker of business, and to developing their business range.
Data mining is defined as one technique set that automatically used to explore comprehensively and bring the complex relations to the surface in the huge data set. The one of data mining method that used in this research is Clustering, it is identify object with the similarity of certain characteristics, and then using those characteristics as the “vector characteristic” or “centroid”.
The result of this research is an application that will make analyze of huge data set easier then helpful to give information as a basic feature of company’s decision makers.
Keywords: business competition, business solution, information technology, data mining, clustering
vi
LEMBAR PENGESAHAN
ABSTRAK ... i
ABSTRACT ... ii
KATA PENGANTAR ... iii
DAFTAR ISI ... vi
DAFTAR TABEL ... xii
DAFTAR GAMBAR ... xiv
DAFTAR SIMBOL ... xvii
DAFTAR LAMPIRAN ... xix
BAB I PENDAHULUAN ... 1
1.1.Latar Belakang Masalah ... 1
1.2.Perumusan Masalah ... 3
1.3.Maksud dan Tujuan ... 4
1.4.Batasan Masalah ... 4
1.5.Metodologi Penelitian ... 5
1.6.Sistematika Penulisan ... 7
BAB II TINJAUAN PUSTAKA ... 9
2.1.Tinjauan Tempat Penelitian ... 9
2.1.1. Sejarah Perusahaan ... 9
vii
2.2.Landasan Teori ... 18
2.2.1. Pengertian Data Mining... 18
2.2.2. Tahapan Data Mining ... 20
2.2.3. Arsitektur Data Mining ... 22
2.2.4. Pengelompokkan (Clustering) ... 23
2.2.4.1. Teknik Clustering ... 26
2.2.4.2. Hierarchical Clustering ... 27
2.2.4.3. Agglomerative ... 27
2.2.4.4. Divisive ... 28
2.2.4.5. Partitional Clustering ... 29
2.2.4.6. Agglomerative Hierarchical Clustering Algorithm (AHC Algorithm) ... 29
2.2.4.7. Contoh Penerapan Clustering Menggunakan Algoritma AHC ... 32
2.2.5. Konsep Dasar Data dan Informasi ... 35
2.2.5.1. Pengertian Data ... 35
2.2.5.2. Pengertian Informasi ... 35
2.2.6. Basis Data (Database) ... 36
2.2.7. Database Management System (DBMS)... 38
2.2.8. ERD (Entity Relationship Diagram)... 40
viii
BAB III ANALISIS DAN PERANCANGAN SISTEM ... 49
3.1.Analisis Sistem ... 49
3.1.1. Analisis Masalah... 49
3.1.2. Analisis Non Fungsional dan Kebutuhan Non Fungsional ... 51
3.1.2.1. Analisis Perangkat Keras ... 51
3.1.2.2. Analisis Perangkat Lunak ... 52
3.1.2.3. Analisis User (Pengguna) ... 52
3.1.3. Analisis Basis Data ... 53
3.2.Analisis Kebutuhan Fungsional ... 55
3.2.1. Diagram Konteks ... 55
3.2.2. Data Flow Diagram (DFD) ... 56
3.2.2.1. DFD Level 1 ... 56
3.2.2.2. DFD Level 2 Proses Pengolahan Data Master ... 57
3.2.2.3. DFD Level 2 Proses Clustering ... 57
3.2.2.4. DFD Level 3 Proses Pengolahan Data User ... 58
3.2.2.5. DFD Level 3 Proses Input Parameter Kelas Wilayah Penjualan ... 59
3.2.2.6. DFD Level 3 Proses Buat Clustering ... 60
3.2.3. Spesifikasi Proses ... 61
3.2.4. Kamus Data ... 74
ix
3.3.2. Perancangan Antar Muka ... 81
3.3.2.1. Perancangan Tampilan Program ... 81
3.3.2.1.1. Tampilan Awal Aplikasi ... 81
3.3.2.1.2. Tampilan Login User ... 82
3.3.2.1.3. Tampilan Menu Utama Setelah Login User... 82
3.3.2.1.4. Tampilan Sub Menu User/Operator ... 83
3.3.2.1.5. Tampilan Sub Menu Hak Akses Menu ... 83
3.3.2.1.6. Tampilan Sub Menu Kelas Wilayah Penjualan ... 84
3.3.2.1.7. Tampilan Sub Menu Import Data Penjualan ... 84
3.3.2.1.8. Tampilan Sub Menu Analisa Clustering ... 85
3.3.2.1.9. Tampilan Sub Menu Ganti Password ... 85
3.3.2.1.10. Tampilan Menu About ... 86
3.3.2.1.11. Tampilan Tambah Data User ... 86
3.3.2.1.12. Tampilan Edit Data User ... 86
3.3.2.1.13. Tampilan History ... 87
3.3.2.1.14. Tampilan Lihat Progress ... 87
3.3.2.2. Perancangan Pesan ... 88
3.3.3. Perancangan format input/import dan output/eksport ... 89
3.3.3.1. Perancangan format input/import ... 89
x
4.1.Implementasi Sistem ... 99
4.1.1. Implementasi Perangkat Keras ... 99
4.1.2. Implementasi Perangkat Lunak ... 100
4.1.3. Implementasi Form ... 100
4.1.4. Implementasi Basis Data ... 101
4.1.5. Implementasi Antar Muka ... 107
4.1.6. Implementasi Pesan ... 114
4.2.Pengujian ... 116
4.2.1. Rencana Pengujian ... 116
4.2.2. Kasus dan Hasil Pengujian Alpha ... 117
4.2.2.1. Pengujian Login ... 117
4.2.2.2. Pengujian Pengolahan Data User ... 118
4.2.2.3. Pengujian Pengolahan Hak Akses User ... 121
4.2.2.4. Pengujian Input Kelas Wilayah Penjualan ... 123
4.2.2.5. Pengujian Import Data Penjualan ... 124
4.2.2.6. Pengujian Analisa Clustering ... 125
4.2.2.7. Pengujian Ganti Password ... 127
4.2.3. Kesimpulan Hasil Pengujian Alpha ... 129
4.2.4. Kasus dan Hasil Pengujian Beta ... 129
xi
xii
DAFTAR TABEL
Tabel 2.1 Data Penjualan Minuman Per Wilayah Tanggal 1 Januari 2007 ... 32
Tabel 2.2 Pembuatan cluster pertama ... 33
Tabel 2.3 Hasil clustering sebanyak tiga cluster ... 34
Tabel 3.1 Karakteristik Pengguna ... 52
Tabel 3.2 Spesifikasi Proses ... 61
Tabel 3.3 Kamus Data Proses Login ... 74
Tabel 3.4 Kamus Data : Data Penjualan ... 74
Tabel 3.5 Kamus Data : Parameter Kelas Wilayah ... 75
Tabel 3.6 Kamus Data : Data history ... 75
Tabel 3.7 Kamus Data : Data detail history ... 75
Tabel 3.8 Kamus Data : Data cluster ... 75
Tabel 3.9 Struktur Tabel User (m_user) ... 77
Tabel 3.10 Struktur Tabel Hak Akses (m_trustee_01)... 77
Tabel 3.11 Struktur Tabel Penjualan (t_penjualan) ... 77
Tabel 3.12 Struktur Tabel Produk (m_product) ... 78
Tabel 3.13 Struktur Tabel Kelas Wilayah (m_kelaswilayah) ... 78
Tabel 3.14 Struktur Tabel History (history) ... 78
Tabel 3.15 Struktur Tabel Detail History (detail_history) ... 78
Tabel 3.16 Struktur Tabel Cluster (cluster) ... 79
Tabel 3.17 Struktur Tabel Temporary (tmp1) ... 79
xiii
Tabel 4.1 Implementasi Form ... 100
Tabel 4.2 Rencana Pengujian Aplikasi Data Mining PT. PEPSI COLA INDOBEVERAGES ... 116
Tabel 4.3 Pengujian Verifikasi User ID dan Password... 117
Tabel 4.4 Pengujian Pengolahan Data User ... 118
Tabel 4.5 Pengujian Pengolahan Hak Akses User ... 121
Tabel 4.6 Pengujian Input Kelas Wilayah Penjualan ... 123
Tabel 4.7 Pengujian Import Data Penjualan ... 124
Tabel 4.8 Pengujian Analisa Clustering... 125
xiv
Gambar 2.1 Struktur Organisasi Perusahaan ... 18
Gambar 2.2 Tahapan pada proses knowledge discovery ... 20
Gambar 2.3 Arsitektur Data Mining ... 23
Gambar 2.4 Ilustrasi Clustering ... 25
Gambar 2.5 Pengelompokan himpunan data menjadi tiga cluster ... 25
Gambar 2.6 Agglomerative dan Divisive ... 27
Gambar 3.1 Entity Relationship Diagram (ERD) ... 54
Gambar 3.2 Diagram Konteks... 55
Gambar 3.3 DFD Level 1 ... 56
Gambar 3.4 DFD Level 2 Proses Pengolahan Data Master ... 57
Gambar 3.5 DFD Level 2 Proses Clustering ... 58
Gambar 3.6 DFD Level 3 Proses Pengolahan Data User ... 59
Gambar 3.7 DFD Level 3 Proses Input Parameter Kelas Wilayah Penjualan ... 60
Gambar 3.8 DFD Level 3 Proses Buat Cluster ... 61
Gambar 3.9 Skema Relasi ... 76
Gambar 3.10 Perancangan Struktur Menu ... 80
Gambar 3.11 Tampilan Awal Aplikasi ... 81
Gambar 3.12 Tampilan Login User ... 82
Gambar 3.13 Tampilan Menu Utama Setelah Login User ... 82
xv
Gambar 3.18 Tampilan Sub Menu Analisa Clustering ... 85
Gambar 3.19 Tampilan Sub Menu Ganti Password ... 85
Gambar 3.20 Tampilan Menu About ... 86
Gambar 3.21 Tampilan Tambah Data User ... 86
Gambar 3.22 Tampilan Edit Data User ... 87
Gambar 3.23 Tampilan History... 87
Gambar 3.24 Tampilan Lihat Progress ... 88
Gambar 3.25 Tampilan Perancangan Pesan ... 88
Gambar 3.26 Tampilan Perancangan Format input/import... 90
Gambar 3.27 Tampilan Perancangan Format output/eksport ... 90
Gambar 3.28 Perancangan Prosedural Flowchart login ... 91
Gambar 3.29 Perancangan Prosedural Flowchart tambah data ... 92
Gambar 3.30 Perancangan Prosedural Flowchart edit data ... 93
Gambar 3.31 Perancangan Prosedural Flowchart hapus data ... 94
Gambar 3.32 Perancangan Prosedural Flowchart import data ... 95
Gambar 3.33 Perancangan Prosedural Flowchart eksport data ... 96
Gambar 3.34 Perancangan Prosedural Flowchart ganti password ... 97
Gambar 3.35 Jaringan Semantik ... 98
Gambar 4.1 Form Tampilan Awal Aplikasi ... 107
xvi
Gambar 4.6 Form Edit User ... 109
Gambar 4.7 Form Pengolahan Hak Akses User... 109
Gambar 4.8 Form Wilayah Penjualan Per Kelas ... 110
Gambar 4.9 Form Import Data Penjualan ... 110
Gambar 4.10 Form Cari File ... 111
Gambar 4.11 Form Analisa Clustering ... 111
Gambar 4.12 Form Ganti Password ... 112
Gambar 4.13 Form About ... 112
Gambar 4.14 Laporan Daftar User... 113
Gambar 4.15 Laporan Hasil Analisa Clustering ... 113
Gambar 4.16 Form History ... 114
Gambar 4.17 Form Lihat Progress ... 114
xvii
Simbol Nama Keterangan
Entity Menunjukkan himpunan entitas
Garis Menunjukkan penghubung antara
himpunan relasi dengan himpunan entitas dan himpunan entitas dengan atributnya
Belah ketupat / Relationship
Menunjukkan himpunan relasi
Atribut Menunjukan item data yang menjadi bagian dari suatu entitas
2. Simbol DataFlowDiagram
Simbol Nama Keterangan
Proses Menunjukkan kegiatan / kerja yang dilakukan oleh orang, mesin atau komputer
Terminator Menunnjukkan bagian dari luar
Arus / Aliran data
Menunjukkan arus dari proses
xviii
Garis alir
(flow line)
Arah aliran program
Proses Proses perhitungan/proses
pengolahan data
Input/output data Proses input/output data, parameter, informasi
Decision Perbandingan pernyataan,
xix
Lampiran B Hasil Kuesioner ... B-1
1
1.1Latar Belakang Masalah
Dalam dunia bisnis yang selalu dinamis dan penuh persaingan, para
pelakunya harus senantiasa memikirkan cara-cara untuk terus survive dan jika
mungkin mengembangkan skala bisnis mereka. Untuk mencapai hal itu, ada tiga
kebutuhan bisnis yang dapat dilakukan, yaitu penambahan jenis maupun
peningkatan kapasitas produk, pengurangan biaya operasi perusahaan, dan
peningkatan efektifitas pemasaran dan keuntungan. Agar bisa memenuhi
kebutuhan-kebutuhan bisnis di atas banyak cara yang dapat ditempuh, salah
satunya adalah dengan melakukan analisis data perusahaan.
PT. Pepsi Cola Indobeverages merupakan perusahaan yang bergerak
dalam bidang industri minuman. Sebagai perusahaan besar, PT. Pepsi Cola
Indobeverages menghasilkan berbagai macam produk minuman dengan nama
yang berbeda. Tidak hanya PT. Pepsi Cola Indobeverages, masih cukup banyak
perusahaan-perusahaan lain yang bergerak di bidang serupa. Hal tersebut tentu
saja menimbulkan persaingan bisnis antar perusahaan.
Produk minuman yang diproduksi oleh PT. Pepsi Cola Indobeverages
tersebut selain memiliki nama yang berbeda, setiap nama dari minuman tersebut
pun memiliki kemasan yang beragam pula. Produk-produk minuman yang
diproduksi tersebut dipasarkan ke banyak kota-kota di Indonesia. Hal ini tentu
Untuk menghadapi persaingan bisnis yang dinamis pihak perusahaan
dituntut agar dapat mengambil keputusan yang tepat dalam menentukan strategi
pemasaran produk yang akan dijualnya. Agar dapat melaksanakan hal tersebut,
perusahaan memerlukan informasi yang cukup untuk dapat dianalisa lebih lanjut.
Informasi yang dihasilkan tentunya adalah hasil analisis dari pengolahan data
penjualan pada perusahaan tersebut. Data penjualan yang sudah ada akan diolah
atau dianalisis untuk mengetahui tingkat kecenderungan konsumen di setiap
tempat tujuan pemasaran produk pada faktor ketertarikannya. Dari pengolahan
data tersebut akan diperoleh suatu pola konsumsi masyarakat terhadap produk dari
perusahaan tersebut.
Ketersediaan data yang melimpah, kebutuhan akan informasi (atau
pengetahuan) sebagai pendukung pengambilan keputusan untuk membuat solusi
bisnis, dan dukungan infrastruktur di bidang teknologi informasi merupakan
cikal-bakal dari lahirnya teknologi data mining. Data mining dimaksudkan untuk
memberikan solusi nyata bagi para pengambil keputusan di dunia bisnis, untuk
mengembangkan bisnis mereka.
Data mining didefinisikan sebagai satu set teknik yang digunakan secara
otomatis untuk mengeksplorasi secara menyeluruh dan membawa ke permukaan
relasi-relasi yang kompleks pada set data yang sangat besar. Set data yang
dimaksud di sini adalah set data yang berbentuk tabulasi, seperti yang banyak
diimplementasikan dalam teknologi manajemen basis data relasional. Akan tetapi,
teknik-teknik data mining dapat juga diaplikasikan pada representasi data yang
mining dapat juga didefinisikan sebagai “pemodelan dan penemuan pola-pola
yang tersembunyi dengan memanfaatkan data dalam volume yang besar” Data
mining menggunakan pendekatan discovery-based dimana pencocokan pola
(pattern-matching) dan algoritma-algoritma yang lain digunakan untuk
menentukan relasi-relasi kunci di dalam data yang diekplorasi. Data mining
merupakan komponen baru pada arsitektur sistem pendukung keputusan (SPK) di
perusahaan-perusahaan.
Pengelompokan (Clustering) mengidentifikasi objek yang memiliki
kesamaan karakteristik tertentu, dan kemudian menggunakan karakteristik
tersebut sebagai “vektor karakteristik” atau “centroid”. Pengelompokan ini
digunakan oleh perusahaan untuk membuat laporan mengenai karakteristik umum
dari grup-grup konsumen yang berbeda. Proses Clustering yang akan dilakukan
menggunakan Agglomerative Hierarchical Clustering Algorithm (AHC
algorithm).
Dari pertimbangan atas penjelasan yang telah dipaparkan diatas, maka
dibuatlah suatu aplikasi PENERAPAN DATA MINING PADA PENJUALAN
PRODUK MINUMAN DI PT. PEPSI COLA INDOBEVERAGES
MENGGUNAKAN METODE CLUSTERING.
1.2 Identifikasi Masalah
Dengan mengacu pada latar belakang masalah diatas, maka permasalahan
Bagaimana cara menerapkan Data Mining pada penjualan produk minuman di PT.
PEPSI COLA INDOBEVERAGES menggunakan metode clustering.
1.3Maksud dan Tujuan
Berdasarkan permasalahan yang diteliti, maka maksud dari penulisan tugas
akhir ini adalah untuk membangun aplikasi Data Mining pada penjualan produk
minuman di PT. Pepsi Cola Indobeverages menggunakan metode clustering.
Sedangkan tujuan yang akan dicapai dalam penelitian ini antara lain :
1. Mempermudah menganalisis data yang besar
2. Membantu memberikan informasi dari data penjualan yang diolah
3. Memberikan gambaran dalam pengambilan keputusan
1.4Batasan Masalah
Adapun batasan masalah yang akan dibahas adalah :
1. Data yang akan dianalisa merupakan data penjualan produk minuman
di PT. PEPSI COLA INDOBEVERAGES.
2. Algoritma yang digunakan dalam metode clustering yang dilakukan
adalah Agglomerative Hierarchical Clustering Algorithm (AHC).
3. Format file yang akan diinputkan berupa file database dengan
berekstensi excel atau xls.
4. Hasil dari analisa tersebut adalah terbentuknya pola penjualan produk
minuman di PT. PEPSI COLA INDOBEVERAGES.
6. Metode yang digunakan adalah metode aliran terstruktur dimana tools
yang digunakan adalah Data Flows Diagram (DFD) dan Entity
Relationship Diagram (ERD).
7. Aplikasi ini dibangun dengan menggunakan bahasa pemrograman
Pascal dengan aplikasi pemrograman Borland Delphi 7 dan Database
menggunakan MySQL.
1.5Metodologi Penelitian
Metodologi yang digunakan dalam penulisan tugas akhir ini adalah
sebagai berikut :
1. Tahap pengumpulan data
Metode pengumpulan data yang digunakan dalam penelitian ini adalah sebagai
berikut :
a. Studi Literatur
Pengumpulan data dengan cara mengumpulkan literatur, jurnal, paper dan
bacaan-bacaan yang ada kaitannya dengan judul penelitian.
b. Observasi
Teknik pengumpulan data dengan mengadakan penelitian dan peninjauan
langsung terhadap permasalahan yang diambil.
c. Interview
Teknik pengumpulan data dengan mengadakan tanya jawab secara langsung
2. Tahap pembuatan perangkat lunak.
Teknik analisis data dalam pembuatan perangkat lunak menggunakan
pemodelan perangkat lunak dengan paradigma waterfall seperti terlihat pada
Gambar 1.1, yang meliputi beberapa proses diantaranya:
a. System / Information Engineering
Merupakan bagian dari sistem yang terbesar dalam pengerjaan suatu proyek,
dimulai dengan menetapkan berbagai kebutuhan dari semua elemen yang
diperlukan sistem dan mengalokasikannya kedalam pembentukan perangkat
lunak.
b. Analisis
Merupakan tahap menganalisis hal-hal yang diperlukan dalam pelaksanaan
proyek pembuatan perangkat lunak.
c. Design
Tahap penerjemahan dari data yang dianalisis kedalam bentuk yang mudah
dimengerti oleh user.
d. Coding
Tahap penerjemahan data atau pemecahan masalah yang telah dirancang
keadalam bahasa pemrograman tertentu.
e. Pengujian
f. Maintenance
Tahap akhir dimana suatu perangkat lunak yang sudah selesai dapat
mengalami perubahan–perubahan atau penambahan sesuai dengan
permintaan user.
Gambar 1.1 Paradigma Waterfall
1.6Sistematika Penulisan
Sistematika penulisan penelitian tugas akhir ini disusun untuk memberikan
gambaran umum tentang penelitian yang dijalankan. Sistematika penulisan tugas
akhir ini adalah sebagai berikut :
BAB I. PENDAHULUAN
Bab ini menguraikan tentang latar belakang permasalahan, mencoba
mengidentifikasi inti permasalahan yang dihadapi, menentukan maksud dan
tujuan penelitian, yang kemudian diikuti dengan pembatasan masalah, metodologi
BAB II. TINJAUAN PUSTAKA
Bab ini membahas tentang tinjauan perusahaan serta berbagai konsep
dasar dan teori-teori yang berkaitan dengan topik penelitian yang dilakukan dan
hal-hal yang berguna dalam proses analisis permasalahan serta tinjauan terhadap
penelitian-penelitian serupa yang telah pernah dilakukan sebelumnya termasuk
sintesisnya.
BAB III. ANALISIS DAN PERANCANGAN SISTEM
Bab ini menganalisis masalah dari data hasil penelitian, kemudian
dilakukan pula proses perancangan sistem yang akan dibangun sesuai dengan analisa
yang telah dilakukan.
BAB IV. IMPLEMENTASI DAN PENGUJIAN
Bab ini berisi tentang implementasi dari tahapan-tahapan penting yang
telah dilakukan sebelumnya kemudian dilakukan pengujian terhadap sistem sesuai
dengan tahapan yang telah dijalani untuk memperlihatkan sejauh mana system
yang dibangun layak digunakan.
BAB V. KESIMPULAN DAN SARAN
Bab ini berisi mengenai kesimpulan atas tugas akhir yang dibuat serta
berisi saran-saran untuk adanya pengembangan mutu dan kualitas bagi masa yang
9
2.1Tinjauan Tempat Penelitian
2.1.1 Sejarah Perusahaan
1965 PepsiCo, Inc. didirikan oleh Donald M. Kendall, Presiden dan
Eksekutif Utama (Chief Executive Officer/CEO) Pepsi-Cola, dan
Herman W. Lay, Pimpinan dan CEO Frito-Lay, melalui
penggabungan kedua perusahaan. Pepsi-Cola diciptakan saat Caleb
Bradham, seorang ahli farmasi dari New Bern, Carolina Utara,
Amerika Serikat, pada akhir tahun 1890-an menciptakan sebuah
minuman bernama “Minuman Brad” (“Brad’s drink”) dengan
tujuan untuk mengobati sakit perut. Minuman itu terbuat dari air
berkarbonat, gula, vanila, minyak pati, pepsin, dan buah kola. Pada
28 Agustus 1898, nama “Minuman Brad” diubah menjadi
“Pepsi-Cola” dan kemudian nama itu didaftar pada 16 Juni 1903. Bradham
memperoleh nama Pepsi dari penyakit dyspepsia (sakit perut atau
ketidakcernaan). Frito-Lay, Inc. dibentuk pada tahun 1961 melalui
gabungan Perusahaan Frito, yang didirikan oleh Elmer Doolin pada
tahun 1932, dan Perusahaan H. W. Lay, yang didirikan oleh
Herman W. Lay pada tahun 1932. Herman Lay sebagai Pimpinan
1966
1971
Kendall sebagai Presiden dan CEO. Perusahaan yang baru ini
memiliki laporan penjualan sebesar 510 juta dolar dan
mempekerjakan 19.000 (sembilan belas ribu) pegawai.
Produk-produk utama dari perusahaan baru ini yaitu:
1. Pepsi-Cola Company – Pepsi-Cola (diformulasikan pada
tahun 1898), Diet Pepsi (1964) dan Mountain Dew
(diperkenalkan oleh Tip Corporation pada tahun 1948).
2. Frito-Lay, Inc. – Keripik jagung merk Fritos (diciptakan
oleh Elmer Doolin pada tahun 1932, keripik kentang merk
Lay’s (diciptakan oleh Herman W. Lay pada tahun 1938),
makanan ringan berperencah keju merk Cheetos (1948),
keripik kentang merk Ruffles (1958) dan kue kering asin
merk Rold Gold (diperoleh pada tahun 1961).
Pepsi memasuki Jepang dan Eropa bagian Timur
CEO PepsiCo, Donald M. Kendall memangku jabatan Pimpinan
Dewan Direktur pada saat pensiunnya Herman W. Lay. Lay tetap
memegang peranan penting dalam korporasi sampai beliau
meninggal pada tanggal 6 Desember 1982.
Andral E. Pearson ditunjuk menjadi presiden Pepsico, jabatan
1973
1974
1976
1980
PepsiCo Foods International (PFI) yang pada akhirnya berganti
nama menjadi Frito-Lay International, didirikan untuk memasarkan
makanan ringan ke seluruh dunia.
Pepsi-Cola menjadi produksi konsumen Amerika pertama yang
diproduksi, dipasarkan, dan terjual di Uni Soviet.
Pepsi memperkenalkan kampanye pemasaran “Pepsi Challenge
(Tantangan Pepsi)” pertama kali di Dallas, Texas tahun 1975, yang
kemudian menjadi kampanye pemasaran nasional. PepsiCo
membuat ujian rasa buta antara Pepsi-Cola dan pesaingnya,
Coca-Cola. Dalam ujian rasa buta itu, kebanyakan dari konsumen
memilih Pepsi sebagai minuman yang lebih enak.
PepsiCo mengadopsi Kode Pergerakan Bisnis Sedunia.
Pepsi-Cola menjadi satu-satunya merk minuman ringan dengan
penjualan terbesar di supermarket-supermarket di Amerika Serikat.
Dengan kampanye pemasaran “Have a Pepsi day!“ “Puppies,” yang
kemudian menjadi salah satu adpertensi/iklan yang paling disukai di
Amerika.
PepsiCo Food Service International (PFSI) dibentuk dengan fokus
pada perkembangan restoran-restoran ke luar negeri.
1984
Penampilan pertama Penghargaan Internasional Donald M. Kendall
Bottler-of-the-Year.
Frito-Lay mulai memasarkan kue merk Grandma’s keseluruh dalam
negeri.
Penata taman, Russel Page (1906-1985) mulai memperluas wilayah
taman di PepsiCo.
Pepsi menjadi penjualan #1 di toko-toko.
PepsiCo distruktur ulang untuk lebih fokus kepada tiga pokok
bisnis: minuman ringan, makanan ringan dan restoran. Bisnis
alat-alat transportasi dan olahraga telah terjual.
Wayne Calloway menjadi presiden PepsiCo.
Diet Pepsi di formulasi ulang dengan 100% NutraSweet.
Diperkenalkan Slice and Diet Slice, minuman ringan pertama
dengan jus buah.
Pepsi-Cola membuat sejarah iklan dengan Michael Jackson
bersaudara sebagai gambaran generasi baru Pepsi-Cola, yang mana
iklan tersebut menjadi televisi komersial sekaligus pemasaran
musik yang paling ditunggu-tunggu. Pepsi menjadi “The Choice of
a New Generation (Pilihan Generasi Baru)”.
Herman W. Lay Award of Excellence menetapkan Frito-Lay sebagai
1990
1995
Saham PepsiCo terpecah menjadi tiga-untuk-satu.
PepsiCo, dengan saham-sahamnya, memegang kedudukan yang
berkuasa dalam perusahaan Gamesa, perusahaan kue terbesar di
Meksiko.
Frito-Lay mengiklankan keripik tortilla merk Doritos bersama
dengan selebritis Jay Leno.
PepsiCo menandatangani perjanjian dagang komersial terbesar
dalam sejarahnya dengan Uni Soviet.
PepsiCo memperoleh keuntungan melebihi 1 miliar dolar untuk
pertama kalinya.
Pepsi-Cola memperkenalkan tema “Nothing else is a Pepsi.”
Pepsi-Cola menjadi adpertensi paling teratas di Super Bowl.
Mountain Dew mensponsori Grammy Awards. Dengan tema “Been
There, Done That, Tried That.”
Perkongsian Pepsi Lipton Tea meluncurkan kampanye periklanan
baru yaitu “There’s only one Original.”
Pepsi-Cola memperkenalkan Smooth Moos Smoothies, susu kocok
rendah lemak.
7Up International meluncurkan 7Up Ice Cola, sebuah minuman
kola jernih terbaru.
Frito-Lay memperluas segmen makanan ringan rendah/tanpa-lemak
1997
2000
PepsiCo memperkenalkan keripik kentang merk Lay’s di 20 market
diseluruh dunia.
Lahirnya situs PepsiCo - http://www.pepsico.com.
Pepsi-Cola mengenalkan kampanye iklan baru dengan tema
“Generation Next.”
Air mineral kemasan Aquafina dipasarkan keseluruh dalam negeri.
Frito-Lay mengumumkan rencana pembelian makanan ringan
berusia 104 tahun, yaitu Cracker Jack, yang terbuat dari campuran
jagung berondong dan kacang yang dilapisi permen dari Borden
Foods Corp.
Pepsi-Cola merayakan Hari Jadi ke-100 tahun pada tahun 1998
dengan mengadakan konferensi pengusaha minuman ringan, yang
dilaksanakan di Hawai. Perayaan tersebut juga sekaligus konferensi
pengusaha minuman ringan yang pertama.
Frito-Lay mengenalkan Keripik Tortilla 3D Doritos, yaitu keripik
dengan bentuk segitiga.
Pepsi-Cola membangkitkan kembali kampanye pemasaran “Pepsi
Challenge (Tantangan Pepsi)”. Tantangan tersebut meliputi
minuman kola reguler Pepsi One dan Diet Coke.
Pepsi-Cola bekerjasama dengan Yahoo Inc., sebuah perusahaan
yang ditujukan kepada remaja dan dewasa muda.
Tropicana, berkongsi dengan Galaxy Foods Co., mengenalkan
minuman susu kedelai dingin-dan-minuman buah, terbuat dari jus,
sup buah kental dicampur dengan susu kedelai dan protein kedelai.
Merk air minum kemasan Aquafina menjadi merk penjualan terbaik
air minum kemasan satu-satunya di saluran dagang eceran di
Amerika Serikat.
PepsiStuff.com, sebuah situs jaringan untuk barang dagangan,
diskon, dan berkas musik digital dari nama-nama terkemuka dalam
bidang perfilman, musik, video game, pakaian, dan olahraga
diluncurkan dalam promosi bersama dengan Yahoo.
Pepsi-Cola meluncurkan “Sierra Mist”, minuman soda lemon, tanpa
kafein.
The North American Coffee Partnership meluncurkan minuman
kopi kemasan Frappucino dengan perencah Karamel, yang
merupakan tambahan perencah keenam bagi minuman kopi praktis
populer tersebut.
PepsiCo, Inc. mencapai kesepakatan untuk mendapatkan saham di
Perusahaan South Beach Beverage, yang merk inovatif SoBe-nya
telah menjadikan perusahaan tersebut sebagai salah satu perusahaan
industri tersukses.
PepsiCo, Inc. dan Perusahaan Quaker Oats mencapai kesepakatan
PepsiCo melengkapi akuisisi mayoritas saham di South Beverage
Co.
Penjualan PepsiCo mencapai 20 miliar dolar dan telah
mempekerjakan 125.000 (seratus dua puluh lima ribu) pegawai
pada akhir tahun.
PepsiCo meluncurkan Diversity@work, situs jaringan
http://www.pepsico.com/diversity.
2.1.2 Visi dan Misi Perusahaan
2.1.2.1 Visi Perusahaan
“Put into action through programs and a focus on environmental
stewardship, activities to benefit society, and a commitment to build
shareholder value by making a truly sustainable company.”
Visi perusahaan terwujud dalam tindakan melalui
program-program dan suatu fokus pada masalah lingkungan, kegiatan-kegiatan
yang bermanfaat bagi masyarakat, dan sebuah komitmen untuk
membangun nilai bagi saham dengan menjadi perusahaan yang
benar-benar tak tergoyahkan.
2.1.2.2 Misi Perusahaan
Misi PT. Pepsi Cola adalah untuk menjadi perusahaan
produk-produk konsumen terdepan yang tepat terfokus pada produk-produk minuman dan
investor sebagaimana perusahaan memberikan kesempatan bagi para
pegawai, rekan bisnis, dan komunitas tempat PT. Pepsi Cola berusaha
untuk berkembang dan memperkaya diri. Dan dalam segala hal yang
dikerjakan, perusahaan berjuang demi kejujuran, keadilan, dan integritas.
2.1.3 Struktur Organisasi Perusahaan
Secara garis besar, PT. Pepsi Cola Indobeverages dipimpin oleh
seorang Presiden Direktur sebagai pimpinan tertinggi perusahaan yang
dibantu oleh beberapa orang yang menempati posisi sebagai direktur pada
struktur inti dari perusahaan. Sedangkan dalam hal produksi, PT. Pepsi
Cola dipimpin oleh seorang Plant Manager yang bertanggung jawab
langsung kepada Presiden Direktur. Plant Manager ini bertugas sebagai
pimpinan tertinggi di bagian produksi (pabrik). Seperti halnya pimpinan
secara umum, Plant Manager juga dibantu oleh para Manager lainnya
sebagai bawahan yang masing-masing bertanggung jawab atas
bagian/departemen yang mereka pimpin. Untuk lebih jelas mengenai
struktur organisasi PT. Pepsi Cola Indobeverages dapat dilihat pada
Gambar 2.1 Struktur Organisasi Perusahaan
2.2Landasan Teori
2.2.1Pengertian Data Mining
Data Mining (DM) adalah salah satu bidang yang berkembang
pesat karena besarnya kebutuhan akan nilai tambah dari database skala
besar yang makin banyak terakumulasi sejalan dengan pertumbuhan
teknologi informasi. Definisi umum dari DM itu sendiri adalah
serangkaian proses untuk menggali nilai tambah berupa pengetahuan
yang selama ini tidak diketahui secara manual dari suatu kumpulan
data.[5]
Data mining adalah kombinasi secara logis antara pengetahuan
data, dan analisa statistik yang dikembangkan dalam pengetahuan bisnis
atau suatu proses yang menggunakan teknik statistik, matematika,
kecerdasan buatan, tiruan dan machine-learning untuk mengekstraksi
dan mengidentifikasi informasi yang bermanfaat bagi pengetahuan yang
Data mining meliputi tugas-tugas yang dikenal sebagai ekstraksi
pengetahuan, arkeologi data, eksplorasi dalam pemrosesan pola data dan
memanen informasi. Semua aktifitas ini dilakukan secara otomatis dan
mengizinkan adanya penemuan cepat bahkan oleh non programmer. [7]
Data mining cerdas menemukan informasi di dalam data
warehouse dimana laporan dan query tidak bisa diungkapkan secara
efektif. Piranti data mining menemukan pola-pola di dalam data dan
bahkan menyimpulkan aturan dari data tersebut.[7]
Data mining (DM) yang juga dikenal sebagai Knowledge
Discovery (Frawley et al., 1992), merupakan salah satu bidang yang
berkembang pesat karena besarnya kebutuhan akan nilai tambah dari
database skala besar yang makin banyak terakumulasi sejalan dengan
pertumbuhan teknologi informasi. Secara umum, data mining dapat
didefinisikan sebagai suatu rangkaian proses untuk menggali nilai
tambah berupa ilmu pengetahuan yang selama ini tidak diketahui secara
manual dari suatu kumpulan data.[1]
Definisi umum dari Data Mining adalah proses pencarian pola-pola
yang menarik (hidden pattern) berupa pengetahuan (knowledge) yang
tidak diketahui sebelumnya dari suatu kumpulan data dimana data
tersebut dapat berada dalam database, data warehouse, atau media
penyimpanan informasi yang lain. Data Mining merupakan proses
tersembunyi pada sejumlah besar data yang disimpan ketika
menjalankan bisnis perusahaan.
2.2.2Tahapan Data Mining
Dalam aplikasinya, data mining sebenarnya merupakan bagian dari
proses Knowledge Discovery in Database (KDD), bukan sebagai
teknologi yang utuh dan berdiri sendiri. Data mining merupakan suatu
bagian langkah yang penting dalam proses KDD terutama berkaitan
dengan ekstraksi dan penghitungan pola-pola dari data yang ditelaah,
seperti ditunjukan oleh gambar 2.2 dibawah ini :[5]
a. Data cleaning
Untuk menghilangkan data noise (data yang tidak
relevan/berhubungan langsung dengan tujuan akhir proses data
mining, misal: data mining yang bertujuan untuk menganalisa hasil
penjualan, maka data-data dalam kumpulan seperti ”nama pegawai”,
”umur”, dan sebagainya dapat di-ignore) dan tidak konsisten.
b. Data integration
Untuk menggabungkan multiple data source.
c. Data selection
Untuk mengambil data yang sesuai untuk keperluan analisa.
d. Data transformation
Untuk mentransformasikan data ke dalam bentuk yang lebih
sesuai untuk di mining.
e. Data mining
Proses terpenting dimana metode tertentu diterapkan untuk
menghasilkan data pattern.
f. Pattern evaluation
Untuk mengidentifikasi apakah interenting patterns yang
didapatkan sudah cukup mewakili knowledge berdasarkan
perhitungan tertentu.
g. Knowledge presentation
Untuk mempresentasikan knowledge yang sudah didapatkan dari
2.2.3Arsitektur Data Mining
Umumnya system data mining terdiri dari komponen-komponen
berikut:
a. Database, data warehouse, atau media penyimpanan informasi
Media dalam hal ini bisa jadi berupa database, data warehouse,
spreadsheets, atau jenis-jenis penampung informasi lainnya. Data
cleaning dan data intregration dapat dilakukan pada datadata
tersebut.
b. Database atau data warehouse server
Database atau data warehouse server bertanggung jawab untuk
menyediakan data yang relevan berdasarkan permintaan dari user
pengguna data mining.
c. Basis Pengetahuan (knowledge base)
Merupakan basis pengetahuan yang digunakan sebagai panduan
dalam pencarian pola.
d. Data mining engine
Yaitu bagian dari software yang menjalankan program berdasarkan
algoritma yang ada.
e. Pattern evaluation module
Yaitu bagian dari software yang berfungsi untuk menemukan
pattern atau pola-pola yang terdapat di dalam database yang diolah
sehingga nantinya proses datamining dapat menemukan knowledge
f. Graphical user interface
Bagian ini merupakan sarana antara user dan sistem data mining
untuk berkomunikasi, dimana user dapat berinteraksi dengan sistem
melalui data mining query, untuk menyediakan informasi yang dapat
membantu dalam pencarian knowledge. Lebih jauh lagi, bagian ini
mengijinkan user untuk melakukan browsing pada database dan data
warehouse, mengevaluasi pattern yang telah dihasilkan, dan
menampilkan pattern tersebut dengan tampilan yang berbeda-beda.[3]
Gambar 2.3 Arsitektur Data Mining
2.2.4Pengelompokan(Clustering)
Pengelompokan (clustering) merupakan tugas deskripsi yang
banyak digunakan dalam mengidentifikasi sebuah himpunan terbatas
pada kategori atau cluster untuk mendeskripsikan data yang ditelaah.
Kategori-kategori ini dapatbersifat eksklusif dan ekshaustifmutual, atau Graphical User Interface (GUI)
Pattern Evaluation
Data Mining Engine
Database or Data Warehouse Server
Database Data
Warehouse
Data Cleaning & Data integration Filtering
mengandung representasiyang lebih kaya seperti kategoriyang hirarkis
atau saling menumpu (overlapping).
Berbeda dengan association rule mining dan classification dimana
kelas data telah ditentukan sebelumnya, clustering melakukan
pengelompokan data tanpa berdasarkan kelas data tertentu. Bahkan
clustering dapat dipakai untuk memberikan label pada kelas data yang
belum diketahui itu. Karena itu clustering sering digolongkan sebagai
metode unsupervised learning.
Prinsip dari clustering adalah memaksimalkan kesamaan antar
anggota satu kelas dan meminimumkan kesamaan antar kelas/cluster.
Clustering dapat dilakukan pada data yang memiliki beberapa atribut
yang dipetakan sebagai ruang multidimensi. Ilustrasi dari clustering
dapat dilihat pada Gambar 2.3 dimana lokasi, dinyatakan dengan bidang
dua dimensi, dari pelanggan suatu toko dapat dikelompokkan menjadi
beberapa cluster dengan pusat cluster ditunjukkan oleh tanda positif (+).
Banyak algoritma clustering memerlukan fungsi jarak untuk
mengukur kemiripan antar data, diperlukan juga metode untuk
normalisasi bermacam atribut yang dimiliki data.
Beberapa kategori algoritma clustering yang banyak dikenal adalah
metode partisi dimana pemakai harus menentukan jumlah k partisi yang
diinginkan lalu setiap data di tes untuk dimasukkan pada salah satu
partisi, metode lain yang telah lama dikenal adalah metode hierarki yang
cluster lebih besar dan top-down yang memecah cluster besar menjadi
cluster yang lebih kecil. Kelemahan metode ini adalah bila salah satu
penggabungan/pemecahan dilakukan pada tempat yang salah, tidak
dapat didapatkan cluster yang optimal. Pendekatan yang banyak diambil
adalah menggabungkan metode hierarki dengan metode clustering
lainnya seperti yang dilakukan oleh Chameleon.[6]
Gambar 2.4 Ilustrasi Clustering
Ada beberapa teknik dalam clustering, yaitu :
1. Metode partisi : membangun berbagai partisi dan kemudian
mengevaluasi partisi tersebut dengan beberapa kriteria.
2. Metode hierarki : membuat suatu penguraian secara hierarkikal dari
himpunan data menggunakan beberapa kriteria.
3. Metode Berbasis densitas : berdasarkan konektivitas dan fungsi
densitas.
4. Metode Berbasis grid : berdasarkan suatu struktur granularitas
multi-level.
5. Metode Berbasis model : suatu model dihipotesakan untuk masing –
masing cluster dan ide untuk mencari best fit dari model tersebut
untuk masing – masing yang lain.
2.2.4.1Teknik Clustering
Secara garis besar metode clustering dibagi dalam 2 tipe yaitu :
hierarchical dan non hierarchical. Hierarchical menggunakan N x N
similarity matrix, sedangkan non hierarchical membagi dataset menjadi
sebuah level single partisi, dengan atau tanpa pencocokan antara
clusters. Selain itu hal mendasar yang membedakan kedua metode ini
adalah : metode pengelompokan hirarki digunakan apabila belum ada
informasi jumlah kelompok, sedangkan metode pengelompokan non
hirarki bertujuan mengelompokan n objek ke dalam k kelompok (k<n).
Berikut adalah perjelasan singkat mengenai perbandingan antarametode
2.2.4.2HierarchicalClustering
Teknik hirarki(hierarchical methods) adalah teknik clustering yang
membentuk kontruksi hirarki berdasarkan tingkatan tertentu seperti
struktur pohon Dengandemikian proses pengelompokkannya dilakukan
secara bertingkat atau bertahap. Hasil dari pengelompokan ini dapat
disajikan dalam bentuk dendogram. Ada dua pendekatan dalam
hierarchical clustering yaitu agglomerative dan divisive. Berikut ini
adalah gambaran mengenai Agglomerative dan Divisive :
Gambar 2.6 Agglomerative dan Divisive
2.2.4.3Agglomerative
Metode ini dimulai dengan setiap N cluster membentuk cluster
masing-masing. Kemudian dua cluster dengan jarak terdekat
bergabung. Selanjutnya cluster yang lama akan bergabung dengan
cluster yang sudah ada dan membentuk cluster baru. Hal ini tetap
memperhitungkan jarak kedekatan antar cluster. Proses akan berlanjut
hingga akhirnya terbentuk satu cluster yang terdiri dari keseluruhan
Beberapa metode dari agglomerative :
1. Single linkage (nearest neighbor methods) : Metode ini
menggunakan prinsip jarak minimum yang diawali dengan
mencari dua cluster terdekat dan keduanya membentuk
cluster yang pertama.
2. Complete linkage (furthest neighbor methods) : Metode ini
merupakan kebalikan dari pendekatan yang digunakan pada
single linkage. Prinsip jarak yang digunakan adalah jarak
terjauh(maksimal) antar cluster.
3. Average linkage between groups methods : Metode ini
mengikuti prosedur yang sama dengan kedua metode
sebelumnya. Prinsip ukuran jarak yang digunakan adalah
jarak rata-rata antar tiap pasangan cluster yang mungkin.
4. Ward’s method error sum of squares : Ward mengajukan
suatu metode pembentukan cluster yang didasari oleh
hilangnya informasi akibat penggabungan cluster menjadi
cluster. Hal ini diukur dengan jumlah total deviasi kuadrat
dari meancluster untuk tiap observasi.
2.2.4.4Divisive
Metode divisive berlawanan dengan metode agglomerative.
Metode ini pertama-tama diawali dengan satu cluster besar yang
mencakup semua cluster. Selanjutnya cluster yang memiliki
cluster yang lebih kecil. Pemisahan ini dilanjutkan sehingga mencapai
sejumlah cluster yang diinginkan.
2.2.4.5PartitionalClustering
Konsep dasar dari partitional clustering adalah membagi n jumlah
cluster kedalam k cluster. Metode ini merupakan metode
pengelompokan yang bertujuan mengelompokan objek sehingga jarak
antar tiap objek ke pusat kelompok didalam satu kelompok adalah
minimum. K-means Clustering dan K-medoids atau PAM (partition
around medoids)merupakan beberapa algoritma dari partitional
clustering. Berikut ini adalah penjelasan singkat dari metode clustering
K-means yaitu :
a. Membagi objek ke dalam k subset tak kosong.
b. Menghitung titik benih sebagai pusat(titik rata – rata dari cluster)
cluster dari partisi sekarang.
c. Memberikan masing – masing objek tersebut ke cluster dengan
titik benih terdekat.
d. Kembali ke tahap yang kedua, berhenti jika tidak ada lagi yang
penugasan baru.
2.2.4.6Agglomerative Hierarchical Clustering Algorithm(AHC
algorithm)
Proses Clustering yang akan dilakukan menggunakan
Agglomerative Hierarchical Clustering Algorithm (AHC algorithm).
hierarchical clustering lebih baik dibandingkan kmeans yang sering
digunakan, karena lebih efisien . Proses dasar dari hierarchical
clustering adalah:
a. Mulailah dengan mendefinisikan setiap item sebagai cluster, jadi
data yang ada sejumlah N items, maka sekarang cluster yang ada
sejumlah N items tersebut. Jarak antara clusters sama dengan jarak
antara items yang ada.
b. Selanjutnya, mencari pasangan cluster yang paling dekat dan
menggabungkan keduanya dalam satu cluster.
c. Hitung jarak antara cluster yang baru dibentuk dengan cluster yang
sudah ada sebelumnya. Ulangi tahap b dan c sampai cluster
membentuk N cluster yang diinginkan.
Ada tiga metode yang ada dalam AHC algorithm dan yang akan
digunakan untuk melakukan clustering adalah metode single linkage.
Metode single lingkage menggunakan prinsip jarak minimum. Dibawah
ini adalah psedeocode dari algoritma Agglomerative Hierarchical
Clustering.
Agglomerative Hierarchical Algorithm:
Given:
a set X of objects {x1,...,xn} a distance function dis(c1,c2)
1. for i = 1 to n ci = {xi}
end for
2. C = {c1,...,cb} 3. l = n+1 4. while C.size > 1 do
b) remove cmin1 and cmin2 from C
c) add {cmin1,cmin2} to C
d) l = l + 1
end while
Contoh : diberikan kumpulan X(dapat dilihat pada gambar ), yang sudah
direpresentasikan dalam bentuk matrix. Dengan menggunakan fungsi
Euclidean distance dan single link method untuk menghitung jarak
antara clusters.
a. pertama, masing – masing anggota (Xi) dari X, ditempatkan dalam
cluster Ci,dimana Ci adalah anggota dari cluster C.
C = {{x1},{x2},{x3}, {x4},{x5},{x6},{x7}, {x8},{x9},{x10}}
b. set l = 11.
c. (iterasi pertama dari penggulangan menggunakan while) C.size =
10. Setelah dilakukan perhitungan jarak maka didapatkan jarak
minimum adalah hasil perhitungan jarak antara C2 dan C10.
(cmin1,cmin2) = (c2,c10)
Pindahkan c2 and c10 from C, tambahkan c11 to C.
C = {{x1},{x3}, {x4},{x5},{x6},{x7}, {x8},{x9},{{x2}, {x10}}}
d. Dan perhitungan terus dilakukan sampai membentuk N cluster yang
diinginkan.
e. Kesimpulan dari hasil clustering yang didapatkan.
Tahapan akhir dari proses clustering adalah kesimpulan dari clustering
yang didapatkan.
2.2.4.7Contoh Penerapan Clustering Menggunakan Algoritma AHC
Dari hasil penelitian yang dilakukan, didapatkan sample data
penjualan produk minuman dari suatu perusahaan. Dari data penjualan
tersebut akan dicoba dilakukan pengelompokan (clustering)
menggunakan algoritma AHC. Adapun data penjualan tersebut dapat
dilihat pada Tabel 2.1 dibawah.
Tabel 2.1 Data Penjualan Minuman Per Wilayah Tanggal 1 Januari 2007
WILAYAH JUMLAH
Bandar Lampung 9803
Bandung 27281
Batam 7488
Bogor 10864
Denpasar 6839
Depok 16291
Jakarta Barat 12653
Jakarta Pusat 11035
Jakarta Selatan 5937
Jakarta Timur 14843
Jakarta Utara 8787
Sesuai dengan algoritma yang diterapkan, maka setiap item wilayah pada
table diatas akan dijadikan sebagai cluster, jadi data yang ada sejumlah
18 items, maka sekarang cluster yang ada sejumlah 18 items tersebut.
Selanjutnya, dari data penjualan (jumlah) dicari pasangan cluster yang
paling dekat (selisih terkecil) dan menggabungkan keduanya dalam satu
cluster. Pembuatan cluster pertama ini dapat dilihat pada Tabel 2.2
berikut :
Tabel 2.2 Pembuatan cluster pertama
WILAYAH JUMLAH
Jakarta Timur 14843
KELOMPOK : A5 | JUMLAH ANGGOTA : 1
Jakarta Barat 12653
KELOMPOK : A6 | JUMLAH ANGGOTA : 1
Jakarta Pusat 11035
KELOMPOK : A7 | JUMLAH ANGGOTA : 1
Bogor 10864
KELOMPOK : A8 | JUMLAH ANGGOTA : 1
Bandar Lampung 9803
KELOMPOK : A9 | JUMLAH ANGGOTA : 1
Malang 9360
KELOMPOK : A10 | JUMLAH ANGGOTA : 2
Jakarta Utara 8787
Pakanbaru 8808
Jakarta Selatan 5937
KELOMPOK : A17 | JUMLAH ANGGOTA : 1
Dari tabel diatas dapat terlihat bahwa pasangan cluster yang paling dekat
yang pertama kali membentuk cluster adalah wilayah Jakarta Utara dan
Pekanbaru yang merupakan anggota kelompok A10. Sedangkan wilayah
lainnya masih merupakan cluster dari dirinya sendiri. Setelah jarak
terdekat membentuk satu cluster pertama, kemudian kita harus
menghitung jarak antara cluster yang baru dibentuk dengan cluster yang
sudah ada sebelumnya. Tahap ini akan diulangi sampai cluster
membentuk N cluster yang diinginkan. Dalam kasus ini, misalnya kita
akan membentuk tiga cluster dari data yang ada, maka hasil dari
algoritma AHC yang digunakan adalah seperti terlihat pada Tabel 2.3
berikut :
Tabel 2.3 Hasil clustering sebanyak tiga cluster
WILAYAH JUMLAH
KELOMPOK : A1 | JUMLAH ANGGOTA : 1
Bandung 27281
KELOMPOK : A2 | JUMLAH ANGGOTA : 10
Jakarta Utara 8787
Pakanbaru 8808
Malang 9360
Bandar Lampung 9803
Bogor 10864
Jakarta Pusat 11035
Jakarta Barat 12653
Jakarta Timur 14843
Depok 16291
Tangerang 17461
KELOMPOK : A3 | JUMLAH ANGGOTA : 7
Padang 4980
Jakarta Selatan 5937
Samarinda 6728
Denpasar 6839
Tasikmalaya 7224
Makassar 7277
2.2.5Konsep Dasar Data dan Informasi
2.2.5.1 Pengertian Data
Menurut Azhar Susanto : “Data adalah fakta atau apapun
yang dapat digunakan input dan menghasilkan informasi”.[6]
Data adalah kenyataan yang menggambarkan suatu kejadiandan
kesatuan kenyataan. Data merupakan suatu istilah yang
berbentuk jamak dari kata “datum” yang berarti fakta atau
bagian dari fakta yang mengandung arti yang menghubungkan
dengan kenyataan, simbol-simbol, gambar-gambar, kata-kata,
angka-angka, huruf-huruf yang menunjukan suatu ide, objek,
kondisi dan situasi.
Menurut the liang gie: ”Data atau bahan keterangan adalah
hal atau peristiwa kenyataan lainnya apapun yang mendukung
suatu pengetahuan untuk dijadikan dasar guna penyusunan
keterangan pembuatan kesimpulan atau penetapan keputusan,
atau data ibarat bahan mentah yang melalui pengolahannya
tertentu lalu menjadi keterangan (informasi)”.
2.2.5.2 Pengertian Informasi
Informasi adalah hasil pengolahan data yang memberikan
2.2.6Basis Data (Database)
Basis data (Database) adalah sekumpulan informasi bermanfaat
yang diorganisasikan kedalam tata cara yang khusus.[6]
Database adalah kumplan data yang saling berkaitan, berhubungan
yang disimpan secara bersama-sama sedemikian rupa tanpa pengulangan
yang tidak perlu, untuk memenuhi berbagai kebutuhan. Data-data ini
harusmengandung semua informasi untuk mendukung semua kebutuhan
sistem.Proses dasar yang dimiliki oleh database ada empat, yaitu:
1.Pembuatan data-data baru (create database)
2. Penambahan data (insert)
3. Mengubah data (update)
4. Menghapus data (delete).
Database merupakan salah satu komponen yang penting dalam
sistem informasi, karena merupakan basis dalam menyediakan informasi
pada para pengguna. Basis data (database) menjadi penting karena
munculnya beberapa masalah bila tidak menggunakan data yang
terpusat, seperti adanya duplikasi data, hubungan antar data tidak jelas,
organisasi data dan update menjadi rumit. Jadi tujuan dari pengaturan
data dengan menggunakan basis data adalah :
a. Menyediakan penyimpanan data untuk dapat digunakan oleh
organisasi saat sekarang dan masa yang akan datang.
b. Cara pemasukan data sehingga memudahkan tugas operator dan
mendapatkan data serta hak-hak yang dimiliki terhadap data yang
ditangani.
c. Pengendalian data untuk setiap siklus agar data selalu up-to-date dan
dapat mencerminakan perubahan spesifik yang terjadi di setiap
sistem.
d. Pengamanan data terhadap kemungkinan penambahan, modifikasi,
pencurian dan gangguan-gangguan lain.
Dalam basis data sistem informasi digambarkan dalam model
entity relationship (E-R). Bahasa yang digunakan dalam basis data
(database) yaitu :
a. DDL (Data Definition Language)
Merupakan bahasa definisi data yang digunakan untuk membuat dan
mengelola objek database seperti database, tabel dan view
b. DML (Data Manipulation Language)
Merupakan bahasa manipulasi data yang digunakan untuk
memanipulasi data pada objek database seperti tabel
c. DCL (Data Control Language)
Merupakan bahasa yang digunakan untuk mengendalikan
pengaksesan data.
Penyusunan basis data meliputi proses memasukkan data kedalam
media penyimpanan data, dan diatur dengan menggunakan perangkat
2.2.7DatabaseManagement System (DBMS)
“Managemen Sistem Basis Data (Database Management System /
DBMS) adalah perangkat lunak yang di desain untuk membantu dalam
hal pemeliharaan dan utilitas kumpulan data dalam jumlah besar”.[6]
Sistem Manajemen Basis data (Database Management System)
merupakan sistem pengoperasian dan sejumlah data pada komputer.
Dengan sistem ini dapat merubah data, memperbaiki data yang salah dan
menghapus data yang tidak dapat dipakai. Sistem manajemen database
merupakan suatu perluasan software sebelumnya mengenai software
pada generasi komputer yang pertama. Dalam hal ini data dan informasi
merupakan kesatuan yang saling berhubungan dan berkerja sama yang
terdiri dari: peralatan, tenaga pelaksana dan prosedur data. Sehingga
pengolahan data ini membentuk sistem pengolahan data. Peralatan dalam
hal ini berupa perangakat keras (hardware) yang digunakan, dan
prosedur data yaitu berupa perangakat lunak (software) yang digunakan
dan dipakai untuk mengalokasikan dalam pembuatan sistem informasi
pengolahan database.
Manipulasi basis data meliputi pembuatan pernyataan (query)
untuk mendapatkan informasi tertentu, melakukan pembaharuan atau
penggantian (update) data, serta pembuatan report dari data. Tujuan
utama DBMSadalah untuk menyediakan tinjauan abstrak dari data bagi
user. Jadi sistem menyembunyikan informasi mengenai bagaimana data
Pertimbangan efisiensi yang digunakan adalah bagaimana merancang
struktur data yang kompleks, tetapi tetap dapat digunakan oleh pengguna
yang masih awam, tanpa mengetahui kompleksitas stuktur data.Sistem
manajemen database atau database management system (DBMS) adalah
merupakan suatu sistem software yang memungkinkan seorang user
dapat mendefinisikan, membuat, dan memelihara serta menyediakan
akses terkontrol terhadap data. Database sendiri adalah sekumpulan data
yang berhubungan dengan secara logika dan memiliki beberapa arti yang
saling berpautan. DBMS yang utuh biasanya terdiri dari :
1. Hardware
Hardware merupakan sistem komputer aktual yang digunakan untuk
menyimpan dan mengakses databse. Dalam sebuah organisasi
berskala besar, hardware terdiri : jaringan dengan sebuah server
pusat dan beberapa program client yang berjalan di komputer
desktop.
2. Software beserta utility Software adalah DBMS yang aktual. DBMS
memungkinkan para user untuk berkomunikasi dengan database.
Dengan kata lain DBMS merupakan mediator antara database
dengan user. Sebuah database harus memuat seluruh data yang
diperlukan oleh sebuah organisasi.
3. Prosedur
Bagian integral dari setiap sistem adalah sekumpulan prosedur yang
diikuti user untuk mendapatkan, memasukkan, menjaga, dan
mengambil data
4. Data
Data adalah jantung dari DBMS. Ada dua jenis data. Pertama, adalah
kumpulan informasi yang diperlukan oleh suatu organisasi. Jenis
data kedua adalah metadata, yaitu informasi mengenai database.
5. User (Pengguna)
Ada sejumlah user yang dapat mengakses atau mengambil data
sesuai dengan kebutuhan penggunaan aplikasi-aplikasi dan interface
yang disediakan oleh DBMS, antara lain adalah :
a. Database administrator adalah orang atau group yang
bertanggungjawab mengimplementasikan sistem database di
dalam suatu organisasi.
b. Enduser adalah orang yang berada di depan workstation dan
berinteraksi secara langsung dengan sistem.
c. Programmer aplikasi, orang yang berinteraksi dengan database
melalui cara yang berbeda.
2.2.8ERD(Entity Relationship Diagram)
Basis data Relasional adalah kumpulan dari relasi-relasi yang
mengandung seluruh informasi berkenaan suatu entitas/ objek yang akan
disimpan di dalam database. Tiap relasi disimpan sebagai sebuah file
tersendiri. Perancangan basis data merupakan suatu kegiaatan yang
a. Menghilangkan redundansi data.
b. Meminimumkan jumlah relasi di dalam basis data.
c. Membuat relasi berada dalam bentuk normal, sehingga dapat
meminimumkan permasalahan berkenaan dengan penambahan,
pembaharuan dan penghapusan.
ERD adalah suatu pemodelan dari basis data relasional yang
didasarkan atas persepsi di dalam dunia nyata, dunia ini senantiasa
terdiri dari sekumpulan objek yang saling berhubungan antara satu
dengan yang lainnya. Suatu objek disebut entity dan hubungan yang
dimilikinya disebut relationship. Suatu entity bersifat unik dan memiliki
atribut sebagai pembeda dengan entity lainnya.
Contoh : entity Mahasiswa, mempunyai atribut nama, umur, alamat, dan
nim.
Diagram E-R terdiri dari:
a. Kotak persegi panjang, menggambarkan himpunan entitas.
b. Elips, menggambarkan atribut-atribut entitas.
c. Diamon, menggambarkan hubungan antara himpunan entitas
d. Garis, yang menghubungkan antar objek dalam diagram E-R
E-R Diagram merupakan suatu bahasa pemodelan dimana
posisinya dapat dianalogikan dengan story board dalam industri film,
blue print arsitektur suatu bangunan, miniatur, dan lain-lain. Dalam
praktiknya, membangun suatu sistem terlebih dahulu dilakukannya suatu
secara keseluruhan sebagai salah satu upaya feedback evaluasi
perampungan suatu perencanaan. E-R Diagram sebagai suatu pemodelan
setidaknya memiliki beberapa karakteristik dan manfaat sebagai berikut:
a. Memudahkan untuk dilakukannya analisis dan perubahan sistem
sejak dini, bersifat murah dan cepat
b. Memberikan gambaran umum akan sistem yang akan di buat
sehingga memudahkan developer.
c. Menghasilkan dokumentasi yang baik untuk client sebagai bahan
diskusi dengan bentuk E-R Diagram itu sendiri, dan
d. Kamus data bagi bagi para pengembang database.
Struktur dari E-R Diagram secara umum ialah terdiri dari:
a. Entitas merupakan objek utama yang informasi akan disimpan,
biasanya berupa kata benda, ex; Mahasiswa, Dosen, Nasabah, Mata
Kuliah, Ruangan, dan lain-lain. Objek dapat berupa benda nyata
maupun abstrak.
b. Atribut merupakan deskripsi dari objek yang bersangkutan
c. Relationship merupakan suatu hubungan yang terjalin antara dua
entitas yang ada.
Kardinalitas Relasi ERD yang mempersentasikan suatu basis data
relasional senantiasa memiliki relasi-relasi dari sejumlah entitas yang
dapat ditentukan banyaknya. Banyaknya suatu relasi yang dimiliki oleh
suatu relasi entitas disebut derajat relasi. Derajat relasi maksimum
modalitas. Kardinalitas yang terjadi diantara dua himpunan entitas (misal
A dan B) dapat berupa :
a. One to One, satu record dipetakan dengan satu record di entitas
lain. Contoh: satu nasabah punya satu account.
b. One to Many, Satu record dapat dipetakan menjadi beberapa
record di entitas lain. Contoh: satu nasabah dapat punya lebih dari
satu account.
c. Many to Many, Beberapa record dapat dipetakan menjadi beberapa
record di entitas lain. Contoh: satu nasabah dapat memiliki lebih
dari satu account. Satu account dapat dimiliki lebih dari satu
nasabah (join account).
2.2.9DFD(Data Flow Diagram)
DFD adalah suatu model logika data atau proses yang dibuat untuk
menggambarkan dari mana asal data dan kemana tujuan data yang keluar
dari sistem, dimana data disimpan, proses apa yang menghasilkan data
tersebut dan interaksi antara data yang tersimpan dan proses yang
dikenakan pada data tersebut.
DFD sering digunakan untuk menggambarkan suatu sistem yang
telah ada atau sistem baru yang akan dikembangkan secara logika tanpa
mempertimbangkan lingkungan fisik dimana data tersebut mengalir atau