SISTEM REKOMENDASI VARIAN RASA BERDASARKAN KLASIFIKASI PELANGGAN PADA PERUSAHAAN BROWNIES AMANDA.

(1)

Hanna Amalia N, 2015

SISTEM REKOMENDASI VARIAN RASA BERDASARKAN KLASIFIKASI PELANGGAN PADA PERUSAHAAN BROWNIES AMANDA

SKRIPSI

Untuk memenuhi sebagian persyaratan mencapai Gelar Sarjana S-1

Program Studi Ilmu Komputer

Oleh:

Hanna Amalia N

0902283

PROGRAM STUDI ILMU KOMPUTER

FAKULTAS PENDIDIKAN MATEMATIKA DAN ILMU PENGETAHUAN ALAM

UNIVERSITAS PENDIDIKAN INDONESIA

(2)

SISTEM REKOMENDASI VARIAN RASA BERDASARKAN KLASIFIKASI PELANGGAN PADA PERUSAHAAN BROWNIES AMANDA

Oleh

Hanna Amalia N

0902283

Sebuah skripsi yang diajukan untuk memenuhi salah satu syarat memperoleh gelar Sarjana pada

Fakultas Pendidikan Matematika dan Ilmu Pengetahuan Alam

Universitas Pendidikan Indonesia

Desember 2014

Hak Cipta dilindungi undang-undang.

(3)

dengan dicetak ulang, difoto kopi, atau cara lainnya tanpa ijin dari penulis.

SISTEM REKOMENDASI VARIAN RASA BERDASARKAN KLASIFIKASI

PELANGGAN PADA PERUSAHAAN BROWNIES AMANDA

HANNA AMALIA N

0902283

DISETUJUI DAN DISAHKAN OLEH PEMBIMBING :

Pembimbing I,

Budi Laksono Putro, M.T.

NIP. 197607102010121001

Pembimbing II,

Wahyudin, M.T.

NIP.197304242008121001

Mengetahui,

Ketua Program Studi Ilmu Komputer

Jajang Kusnendar, M.T.

(4)

(5)

vi

DAFTAR ISI

ABSTRAK ... i

ABSTRACT ... ii

KATA PENGANTAR ... iii

UCAPAN TERIMA KASIH ... iv

DAFTAR ISI ... vi

DAFTAR TABEL ... ix

DAFTAR GAMBAR ... xi

BAB I PENDAHULUAN ... 1

1.1 Latar Belakang... 1

1.2 Rumusan Masalah ... 4

1.3 Batasan Masalah ... 4

1.4 Tujuan Masalah ... 5

1.5 Manfaat Penelitian ... 5

1.6 Metodelogi Penelitian ... 5

1.7 Sistematika Penulisan ... 8

BAB II KAJIAN PUSTAKA ... 10

2.1 Sistem Rekomendasi ... 10

2.2 Definisi Informasi ... 11

2.3 Data Mining... 13

(6)

vii

2.5 Definisi Klasifikasi ... 17

2.6 Naive Bayes ... 19

2.7 Hypertext Preprocessor ( PHP ) ... 22

2.8 MYSQL ... 24

2.9XAMPP ... 25

2.10 Perangkat Pemodelan Sistem ... 26

2.10.1 Data Flow Diagram Context Level ... 26

2.10.2Data Flow Diagram Levelled ... 27

BAB III METODE PENELITIAN ... 28

3.1 Desain Penelitian ... 28

3.2 Alat dan Bahan Penelitian ... 33

3.2.1 Alat Peneltian ... 33

3.2.2 Bahan Penelitian ... 33

3.3 Metode Pengembangan Perangkat Lunak ... 34

BAB IV HASIL PENELITIAN ... 36

4.1 Hasil Penelitian ... 36

4.1.1 Proses Klasifikasi Data Mining ... 36

4.1.2 Hasil Survey ... 39

4.2 Implementasi Algoritma ... 46

4.2.1 Implementasi Algoritma Naive Bayes ... 46

4.3 Hasil Informasi Survei ... 55

4.4.1 Varian Rasa Coklat ... 56

(7)

viii

4.4.3 Varian Rasa Blueberry ... 61

4.4 Evaluasi Model ... 64

BAB V PENUTUP ... 75

5.1 Kesimpulan ... 75

5.2 Saran ... 76

DAFTAR PUSTAKA

(8)

ix

DAFTAR TABEL

Tabel 4.1 Perhitungan Chi Square JenisKelamin-Varian Rasa... 41

Tabel 4.2 Perhitungan Chi Square Usia-Varian Rasa ... 42

Tabel 4.3 Perhitungan Chi Square Status Pekerjaan-Varian Rasa ... 43

Tabel 4.4 Perhitungan Chi Square Hdm-Varian Rasa ... 44

Tabel 4.5 Data Atribut Jenis Kelamin ... 45

Tabel 4.6 Data Atribut Usia ... 45

Tabel 4.7 Data Atribut Status Pekerjaan ... 45

Tabel 4.8 Data Atribut Hari Dominan Membeli ... 46

Tabel 4.9 Data Atribut Varian Rasa ... 46

Tabel 4.10 Contoh Sampel Penelitian ... 47

Tabel 4.11 Hasil prediksi berdasarkan Algoritma Naive Bayes... 51

Tabel 4.12 Script Algoritma Naïve Bayes ... 51

Tabel 4.13 Jumlah Pelanggan Berdasarkan Jenis Kelamin-Coklat... 56

Tabel 4.14 Jumlah Pelanggan Berdasarkan Status Pekerjaan-Coklat ... 57

Tabel 4.15 Jumlah Pelanggan Berdasarkan Hdm-Coklat ... 57

Tabel 4.16 Jumlah Pelanggan Berdasarkan Jenis Kelamin-Keju ... 58

Tabel 4.17 Jumlah Pelanggan Berdasarkan Status Pekerjaan-Keju ... 59

Tabel 4.18 Jumlah Pelanggan Berdasarkan Hdm-Keju ... 60

Tabel 4.19 Jumlah Pelanggan Berdasarkan Jenis Kelamin-Blueberry ... 61

Tabel 4.20 Jumlah Pelanggan Berdasarkan Status Pekerjaan- Blueberry ... 62

(9)

x

Tabel 4.22 Data Percobaan ... 66

Tabel 4.23 Data Percobaan Lanjutan ... 67

Tabel 4.24 Hasil Percobaan ... 69

Tabel 4.25 Confussion Matrix Hasil Prediksi Algoritma Naive Bayes ... 72

Tabel 4.26 Tabel Producer Accuracy ... 73

(10)

xi

DAFTAR GAMBAR

Gambar 2.1 Top Level (CD), dan Level 0 ... 27

Gambar 3.1 Desain Penelitian ... 28

Gambar 3.2 Model Sekuensial Linear... 34

Gambar 4.3 Diagram Pemilih Rasa Coklat Pada Jenis Kelamin ... 56

Gambar 4.4 Diagram Pemilih Rasa Coklat Pada Status Pekerjaan... 57

Gambar 4.5 Diagram Pemilih Rasa Coklat Pada Hari Dominan Membeli ... 58

Gambar 4.6 Diagram Pemilih Rasa Keju Pada Jenis Kelamin ... 59

Gambar 4.7 Diagram Pemilih Rasa Keju Pada Status Pekerjaan ... 60

Gambar 4.8 Diagram Pemilih Rasa Coklat Pada Hari Dominan Membeli ... 61

Gambar 4.9 Diagram Pemilih Rasa Blueberry Pada Jenis Kelamin ... 62

Gambar 4.10 Diagram Pemilih Rasa Blueberry Pada Status Pekerjaan ... 63

(11)

28 Hanna Amalia N, 2015

BAB III METODE PENELITIAN

3.1 DESAIN PENELITAN

Gambar 3.1. Desain Penelitian

Studi Literatur 1 CRM

2.Naive Bayes

Pengolahan Data Penelitian

(12)

Berikut adalah penjelasan dari desain penelitian, yaitu :

1. Studi Literatur

Studi literatur berisi pengumpulan sumber-sumber teori yang dipelajari dan

dipahami untuk digunakan dalam penelitian.Teori yang akan digunakan seperti

Customer Relationship Management, Metode Naive Bayes.

Pengumpulan data dan materi dengan cara mengumpulkan literatur, jurnal,

websitedan bacaan-bacaan lain yang terkait dengan penelitian.

2. Pengolahan Data Penelitian

Data penelitian merupakan bahan acuan yang dijadikan untuk melakukan

perancangan dan pengembangan perangkat lunak yang diperoleh dari studi

literatur. Dalam penelitian ini data mengenai varian rasa diperoleh dari

Perusahaan Amanda, serta mengunjungi cabang toko kue Amanda.

Untuk menentukan kriteria dari masing-masing himpunan tiap variabel dari

pelanggan dilakukan dengan membuat kuesioner mengenai pelanggan yang

dianggap sesuai dengan himpunan yang ada seperti varian rasa yang disukai

tiap-tiap pelanggan, seperti coklat (original), coklat keju (cheese cream), blueberry.

Untuk penentuan kriteria ini diambil dari jumlah responden yang menjawab

varian rasa apa yang mereka suka, faktor apa yang mempengaruhi mereka

(13)

Metode pengumpulan data yang digunakan adalah Metode Random

Sampling, dengan cara accidental dengan kata lain, Metode Accidental ialah

pengambilan sampel dengan cara mengambil sampel dari sumber yang datang ke

tempat atau lokasi dimana yang akan kita teliti. Pada penelitian ini, karena yang

diteliti adalah konsumen sebuah produk makanan yang dimana konsumen tersebut

datang dan membeli produk makanan tersebut di toko yang khusus menjual

produk itu sendiri.

Pengumpulan data dilakukan dengan cara menyebar kuesioner secara acak

hingga jumlah terpenuhi.Untuk menentukan jumlah sampel yang dibutuhkan,

dikarenakan besar populasi tidak diketahui , maka besar sampel dihitung

menggunakan rumus Lemeshowoleh Stanley Lemeshow (1997) sebagai berikut :

Keterangan :

n = jumlah sampel yang dibutukan

Z = score Z, berdasarkan nilai yang diinginkan

= derajat kepercayaan

(14)

p= proporsi kasus yang diteliti dalam populasi, gunakan p terbesar p=0,5 jika p

tidak diketahui

q= 1- p, yaitu proporsi untuk terjadinya suatu kejadian, Jika p menggunakan p

terbesar maka q= 1-0,5=0,5

Toleransi Kesalahan dinyatakan dalam bentuk persen. Semakin besar

toleransi kesalahan, maka semakin kurang akurat sampel untuk mewakili

populasi, sebaliknya semakin kecil toleransi kesalahan, maka semakin akurat

sampel yang menggambarkan populasinya.. Pada penelitian ini digunakan batas

toleransi kesalahan 5 % sehingga batas toleransi kesalahan adalah 0,05.

Besaran nilai Z ditentukan berdasarkan dengan nilai , jika 5 %,

maka ditetapkan nilai Z ialah 1,96, maka Z2=3,84 dibulatkan menjadi 4. Maka

rumus untuk mengetahui jumlah sampel yang dibutukan dituliskan sebagai berikut

:

dengan class (label) C. P(H) adalah peluang dari hipotesa H, misalkan label untuk

(15)

data sampel yang diamati. P(E|H) adalah peluang data| sampel E, bila diasumsikan

bahwa hipotesa valid. Untuk masalah klasifikasi yang dihitung adalah P(H|E),

yaitu peluang bahwa hipotesa benar untuk data sample E yang diamati.

3. Desain Algoritma Naive Bayes

Pada tahap ini terdapat beberapa proses yang akan menghasilkan suatu

rekomendasi dalam pembelian Brownies sesuai dengan kriteria yang telah dipilih.

a. Menghitung jumlah Class/Label

Menghitung jumlah masing-masing class yang akan dicari terhadap dibagi

dengan jumlah data.

b. Menghitung jumlah kasus yang sama dengan class yang sama

Menghitung salah satu variabel hipotesa terhadap class yang akan dicari

c. Pengkalian semua hasil variabel

Menghitung hasil class berdasarkan perkalian semua variabel yang telah

didapatkan.

d. Pembandingan hasil class yang dicari

Bandingkan hasil class yag dicari untuk menemukan hasilnya berdasarkan

hipotesa

4. Pembangunan Perangkat Lunak

Perancangan perangkat lunak ini dengan model sekuensial linear yang

meliputi analisis, design, coding, dan testing.

5. Dokumentasi

Pembuatan laporan penelitian/skripsi , dokumen teknis dan paper, dan juga

(16)

3.2 ALAT DAN BAHAN PENELITIAN

3.2.1 Alat Penelitian

Alat penelitian menggunakan perangkat keras dan perangkat lunak

dengan rincian sebagai berikut:

1. Komputer dengan spesifikasi sebagai berikut:

a. Processor Intel Core 2 Duo 2,2 Ghz

b. RAM 2 GB

c. Hardisk 320 GB

d. VGA NVIDIA Gforce 512 Mb

e. Resolusi layar 1280 x 800 32 bit color

f. Keyboard dan Mouse

Perangkat lunak dengan spesifikasi sebagai berikut :

a. Sistem Operasi Microsoft Windows 7 Home Premium

b. XAMPP 1.7.2 Win 32 (PhpMyAdmin, MySql)

c. Notepad++

d. Browser Google Chrome dan Mozilla Firefox

3.2.2 Bahan Penelitian

a. Data Varian Rasa Kue Brownies Amanda

(17)

System/Information Engineering

c. Paper/textbook yang didapat dari World Wide Web

3.3 METODE PENGEMBANGAN PERANGKAT LUNAK

Metode Pengembangan Perangkat Lunak yang digunakan dalam penelitian ini

adalah model sekuensial linear. Model ini mengusulkan sebuah pendekatan

kepada perkembangan softwareyang sistematik dan sekuensial yang mulai pada

tingkat dan kemajuan sistem pada seluruh analisis, desain, kode, dan pengujian

(Pressman : 2002).

Berikut ini gambar dari model Sekuensial Linear.

as

Berikut penjelasan dari model Sekuensial Linear:

a. Analisis

Tahap ini merupakan tahap awal dalam analisis kebutuhan sistem.

Melakukan analisis terhadap kebutuhan sistem (fungsional dan non

fungsional), kebutuhan pengguna, kebutuhan informasi, dan kebutuhan

antarmuka eksternal. Tujuannya yaitu mengetahui informasi, model, dan

spesifikasi dari sistem yang dibutuhkan. Pada penelitian ini menggunakan

AnaliAnfa Deign _Coding _Testing

Gambar 3.2 Model Sekuensial Linear

(18)

Data Flow Diagram(DFD), kamus data (data dictionary) dan spesifikasi

proses (process specification) untuk memodelkan sistem.

b. Design

Tahap ini merupakan hasil analisis yang akan dimodelkan pada sistem

tentang bagaimana perangkat lunak dapat berfungsi dan spesifikasi perangkat

lunak. Tahap desain meliputi perancangan data, perancangan arsitektur,

representasi interface, dan perancangan prosedur.

c. Coding

Tahap ini merupakan proses penerjemahan hasil desain kedalam bahasa

pemrograman yang dapat dimengerti oleh komputer (coding). Pada penelitian

ini sistem dibangun nenggunakan bahasa pemrograman PHP dan MySql.

d. Testing

Tahap ini merupakan pengujian dari beberapa tahap sebelumnya. Proses

ini difokuskan pada logika internal dari perangkat lunak yang memastikan

bahwa semua statement telah diuji, dan pada eksternal fungsional. Tujuannya

adalah untuk memastikan bahwa input dan output yang dihasilkan sesuai

dengan yang diharapkan dan mencari apabila terdapat kesalahan-kesalahan

yang belum teratasi sehingga sistem yang telah dibuat sesuai dengan

kebutuhan.Pengujian dilakukan dengan memilih satu variabel dan dua

(19)

BAB V

PENUTUP

1.1KESIMPULAN

Berdasarkan hasil penelitian pada tugas akhir ini didapatkan kesimpulan

bahwa :

1. Berdasarkan hasil survei pada penelitian ini didapatkan klasifikasi

pelanggan berdasarkan varian rasa apa yang paling sesuai dengan kriteria

pelanggan, dengan menggunakan metode klasifikasi Naive Bayes,

berdasarkan jenis kelamin, status pekerjaan, usia, dan hari dominan

membeli. Sebagai contoh wanita berusia 20 tahun, bekerja, dan hari

dominan membeli pada hari kerja, didapat hasil perhitungan bahwa dia

dominan akan membeli rasa keju sesuai dengan perhitungan algoritma

Naive Bayes.

2. Dari data yang sudah dikumpulkan terdapat informasi secara umum bahwa

wanita merupakan pembeli terbanyak pada varian rasa keju, sedangkan

pada pria adalah pembeli varian rasa coklat terbanyak, dari total

keseluruhan ditemukan bahwa pria adalah pembeli terbanyak dalam

pembelian Brownies Amanda tersebut. Dalam prosentase ditemukan

bahwa 58 % pembeli Brownies Amanda ialah pria dan 42 % pembeli ialah

wanita. Pembeli terbanyak pria dapat diasumsikan bahwa pria tersebut

(20)

untuk individu dirinya, sehingga tidak menutup kemungkinan bahwa pria

lebih banyak membeli produk Brownies Amanda tersebut. Selain itu toko

pun harus menyediakan produk yang paling banyak dibeli pada hari

tertentu. Dari data yang diperoleh, dapat diinformasikan bahwa brownies

bervarian rasa keju adalah varian rasa yang paling banyak dicari ataupun

dibeli,sedangkan pada hari biasa coklatlah yang menjadi favorit varian rasa

yang paling sering dibeli.

3. Metode Klasifikasi dengan Algoritma Naive Bayes didukung oleh ilmu

probabilistik khususnya dalam penggunaan data petunjuk untuk

mendukung keputusan pengklasifikasian. Dengan menghitung akurasi

algoritma yang digunakan diperoleh 54 % akurasi sistem, dan error rate

sebesar 46 %. Dengan akurasi tersebut dikarenakan data yang kurang

banyak, sehingga tidak diperoleh akurasi yang sangat tinggi.

1.2SARAN

Untuk pengembangan penelitian selanjutnya penulis menyarankansuatu

hal yaitu pengembangan dengandata yang lebih banyak lebih dari seribu data agar

akurasi dan penggunaan metode dapat tercapai dengan baik. Selain itu, dapat pula

dengan penggunaan metode lain dan membandingkan metode mana yang paling

(21)

Metode yang peneliti terapkan dalam tugas akhir ini merupakan salah satu

upaya untuk mengetahui produk mana yang dijadikan pilihan dalam

pembeliannya pada sebuah produk makanan, yaitu Brownies Amanda.

Namun tidak menutup kemungkinan bahwa ada metode klasifikasi lain

seperti Apriori,Decision Tree dan lain sebagainya, yang lebih baik atau terdapat

pengembangan dan perbaikan terhadap metode yang sudah ada.

Semoga apa yang sudah di peneliti jelaskan dalam penelitian ini dapat

menginspirasi pihak yang lain untuk mengembangkan atau memecahkan suatu