• Tidak ada hasil yang ditemukan

PERBANDINGAN ALGORITMA NAIVE BAYES DAN APRIORI DALAM SISTEM REKOMENDASI PEMILIHAN WARNA CAT DINDING KAMAR TIDUR BERDASARKAN KEPRIBADIAN.

N/A
N/A
Protected

Academic year: 2017

Membagikan "PERBANDINGAN ALGORITMA NAIVE BAYES DAN APRIORI DALAM SISTEM REKOMENDASI PEMILIHAN WARNA CAT DINDING KAMAR TIDUR BERDASARKAN KEPRIBADIAN."

Copied!
38
0
0

Teks penuh

(1)

PERBANDINGAN ALGORITMA NAIVE BAYES DAN APRIORI DALAM SISTEM REKOMENDASI PEMILIHAN WARNA CAT DINDING

KAMAR TIDUR BERDASARKAN KEPRIBADIAN

SKRIPSI

Diajukan untuk Memenuhi Sebagian dari Syarat Memperoleh Gelar Sarjana Komputer

Program Studi Ilmu Komputer

Oleh: Juwita Juanda

0801361

PROGRAM STUDI ILMU KOMPUTER

FAKULTAS PENDIDIKAN DAN ILMU PENGETAHUAN ALAM UNIVERSITAS PENDIDIKAN INDONESIA

(2)

PERBANDINGAN ALGORITMA NAIVE BAYES DAN APRIORI DALAM SISTEM REKOMENDASI PEMILIHAN WARNA CAT DINDING

KAMAR TIDUR BERDASARKAN KEPRIBADIAN

Oleh Juwita Juanda

0801361

Sebuah skripsi yang diajukan untuk memenuhi salah satu syarat memperoleh gelar Sarjana pada Fakultas Pendidikan Matematika dan Ilmu Pengetahuan Alam

© Juwita Juanda 2014 Universitas Pendidikan Indonesia

Juni 2014

Hak Cipta dilindungi undang-undang.

(3)

PERBANDINGAN ALGORITMA NAIVE BAYES DAN APRIORI DALAM SISTEM REKOMENDASI PEMILIHAN WARNA CAT DINDING

KAMAR TIDUR BERDASARKAN KEPRIBADIAN

JUWITA JUANDA 0801361

DISETUJUI DAN DISAHKAN OLEH PEMBIMBING:

Pembimbing I

Rasim, MT

NIP. 197407252006041002

Pembimbing II

Asep Wahyudin, MT NIP. 197112232006041001

Mengetahui

Ketua Program Studi Ilmu Komputer

Rasim, MT

(4)
(5)

LEMBAR PERNYATAAN

Saya menyatakan bahwa skripsi yang berjudul “Perbandingan Algoritma

Naive Bayes dan Apriori Dalam Sistem Rekomendasi Pemilihan Warna Cat

Dinding Kamar Tidur Berdasarkan Kepribadian” ini sepenuhnya karya saya

sendiri. Tidak ada bagian di dalamnya yang merupakan plagiat dari karya orang lain dan saya tidak memelakukan penjiplakan atau pengutipan dengan cara-cara yang tidak sesuai dengan etika keilmuan yang berlaku dalam masyarakat keilmuan. Atas pernyataan ini, saya siap menanggung resiko/sanksi yang dijatuhkan kepada saya apabila kemudian ditemukan adanya pelanggaran terhadap etika keilmuan dalam karya saya ini.

Bandung, Juni 2014

Yang membuat pernyataan,

(6)

ABSTRAK

PERBANDINGAN ALGORITMA NAIVE BAYES DAN APRIORI DALAM SISTEM REKOMENDASI PEMILIHAN WARNA CAT DINDING

KAMAR TIDUR BERDASARKAN KEPRIBADIAN

Juwita Juanda, 0801361, juwitajuanda@gmail.com

Dalam membangun sistem rekomendasi, terdapat beberapa algoritma yang dapat digunakan, antara lain algoritma Naive Bayes dan Apriori. Algoritma Naive

Bayes dan Apriori adalah algoritma yang dapat dimanfaatkan dalam proses

klasifikasi data berjenis nominal. Sebagai dua algoritma klasifikasi yang berbeda, kedua algoritma ini memiliki beberapa perbedaan ataupun persamaan. Perbedaan dan persamaan di antara kedua algoritma tersebut dapat diketahui dengan cara melakukan perbandingan. Perbandingan algoritma dapat dilakukan dengan beberapa cara, antara lain dengan cara membandingkan akurasi dan kompleksitas algoritma. Perbandingan algoritma bertujuan untuk mendapatkan algoritma yang dianggap paling baik pada proses klasifikasi suatu permasalahan, karena sebuah algoritma yang dianggap bekerja baik pada kasus A, maka belum tentu bisa menghasilkan hasil klasifikasi yang baik pada kasus B. Maka, diharapkan dengan adanya penelitian dalam perbandingan algoritma Naive Bayes dan Apriori, dapat diketahui algoritma klasifikasi yang baik untuk menyelesaikan masalah pemilihan warna cat dinding kamr tidur berdasarkan kepribadian.

Kata Kunci : Sistem Rekomendasi, Perbandingan Algoritma, Naive Bayes,

(7)

ABSTRACT

COMPARISON OF NAIVE BAYES AND APRIORI ALGORITHM ON RECOMMENDATION SYSTEM FOR CHOOSING BEDROOM PAINT

COLOR BASED ON PERSONALITY

Juwita Juanda, 0801361, juwitajuanda@gmail.com

In building a recommendation systems , there are several algorithms that can be used , there are Naive Bayes algorithm and Apriori algorithm. Naive Bayes and Apriori algorithm are algorithm that can be utilized in the nominal data type classification process. As two different classification algorithms, both of them have some differences and similarities. Differences and similarities between them can be discovered by comparing the both algorithm. Comparison of the algorithm can be done in several ways, such as comparing accuracy and complexity of the algorithms. Comparison algorithm aims to obtain an algorithm that is the best for classiffication process of a problems, because an algorithm that works well on some case, but isn’t works well on another case. Thus, in this research of comparison algorithm Naive Bayes and Apriori , it can be seen that a good classification algorithm to solve the problem wall room paint color selection was based on personality.

(8)

DAFTAR ISI

ABSTRAK ...i

ABSTRACT ...ii

KATA PENGANTAR...iii

UCAPAN TERIMAKASIH ...iv

DAFTAR ISI ...vi

DAFTAR TABEL ...ix

DAFTAR GAMBAR ...xi

BAB I PENDAHULUAN ...1

1.1 Latar Belakang ...1

1.2 Rumusan Masalah ...4

1.3 Tujuan Penelitian ...5

1.4 Batasan Masalah ...6

1.5 Metode Penelitian ...6

1.6 Sistematika Penulisan ...8

BAB II KAJIAN PUSTAKA ...10

2.1 Landasan Teori...10

(9)

2.1.2 Data Mining ...13

2.1.3 Klasifikasi ...17

2.1.4 Naive Bayes...20

2.1.5 Apriori...22

2.1.6 Data Demografi ...25

2.1.7 Warna ...26

2.1.8 Teori Kepribadian Manusia ...29

2.1.9 Psikologi Warna dalam Interior...31

2.2 Tinjauan Perangkat Lunak ...34

2.2.1 PHP ...34

2.2.2 XAMPP...35

2.2.3 MySQL ...36

2.2.4 Data Flow Diagram (DFD) ...37

2.2.5 Metode Pengembangan Perangkat Lunak ...38

BAB III METODOLOGI PENELITIAN ...39

3.1 Desain Penelitian ...39

BAB IV HASIL PENELITIAN...51

4.1 Hasil Penelitian...51

(10)

4.1.2 Hasil Survey ...54

4.2 Implementasi Algoritma ...59

4.2.1 Implementasi Algoritma Naive Bayes ...59

4.2.2 Implementasi Algoritma Apriori ...64

4.3 Perbandingan Algoritma Naive Bayes dan Apriori ...72

4.3.1 Perbandingan Kompleksitas Algoritma ...72

4.3.2 Perbandingan Akurasi ...86

BAB V PENUTUP ...96

5.1 Kesimpulan ...96

5.2 Saran ...97

(11)

DAFTAR TABEL Tabel

2.1 Tipe Kepribadian Manusia Berdasarkan Teori Hipocrates ...30

2.2 Komponen Data Flow Diagram ...37

3.1 Besar nilai Z disesuaikan dengan Nilai α ...43

4.1 Kategori Umur Depkes RI Tahun 2009 ...52

4.2 Data Atribut Jenis Kelamin...55

4.3 Data Atribut Tipe Kepribadian ...55

4.4 Data Atribut Golongan Warna ...56

4.5 Hasil Pengurutan Data Atribut Umur ...55

4.6 Informasi yang didapatkan dari Atribut Umur ...58

4.7 Tabel Distribusi Frekuensi Atribut Umur...58

4.8 Kategori Umur Depkes RI Tahun 2009 ...59

4.9 Jumlah Data Atribut Umur Berdasarkan Kategori Umur ...59

4.10 Contoh Data yang akan Diproses dengan Algoritma Naive Bayes ...61

4.11 Hasil Prediksi Menggunakan Algoritma Klasifikasi Naive Bayes...65

4.12 Contoh Data yang akan Diproses dengan Algoritma Apriori ...66

4.13 Proses Pengkategorian ...67

4.14 Pola Kombinasi 2 Itemsets ...70

4.15 Hasil Seleksi Kombinasi Itemsets...70

(12)

4.17 Nilai Support, Nilai Confidence, dan Nilai Support x Confidence ...71

4.18 Contoh Data yang akan Diproses dengan Algoritma Apriori ...71

4.19 Data Hasil Perhitungan Algoritma Apriori ...71

4.20 Hasil Prediksi Menggunakan Algoritma Apriori ...72

4.21 Script Algoritma Naive Bayes ...76

4.22 Script Algoritma Apriori ...80

4.23 Hasil Perhitungan Cyclomatic Complexity pada Algoritma Naive Bayes dan Algoritma Apriori...86

4.24 Data Percobaan...87

4.25 Hasil Percobaan dengan 50 Data ...90

4.26 Hasil Prediksi Algoritma Naive Bayes dan Apriori ...92

4.27 Tabel Confussion Matrix Hasil Prediksi Algoritma Naive Bayes ...93

4.28 Producer Accuracy Atribut pada Algoritma Naive Bayes ...93

4.29 User Accuracy Atribut pada Algoritma Naive Bayes ...93

4.30 Tabel Confussion Matrix Hasil Prediksi Algoritma Apriori ...94

4.31 Producer Accuracy Atribut pada Algoritma Apriori ...94

(13)

DAFTAR GAMBAR Gambar

2.1 Urutan Langkah Data Mining...17

2.2 Warna Primer ...27

2.3 Warna Sekunder...28

2.4 Warna Tersier...28

2.5 Warna Netral...28

2.6 Metode Waterfall Sequential Linear ...39

3.1 Desain Penelitian ...40

3.2 Metode Waterfall Sequential Linear ...49

4.1 Flowchart Algoritma Naive Bayes ...73

4.2 Flowgraph Algoritma Naive Bayes ...75

4.3 Flowchart Algoritma Apriori ...80

(14)

1

BAB 1

PENDAHULUAN

1.1 LATAR BELAKANG

Kamar tidur yang nyaman merupakan dambaan setiap orang. Untuk memperoleh kamar tidur yang nyaman dibutuhkan beberapa sentuhan elemen interior yang dapat menunjang dan meningkatkan rasa nyaman tersebut, salah satunya adalah dengan cara memilih warna cat dinding kamar tidur yang cocok bagi individu yang menempati kamar tidur tersebut.

Menurut Cahaya Lituhayu, ruang yang ditempati seseorang memiliki pengaruh kuat terhadap kondisi psikologis orang tersebut. Menurut M. Sahid Indraswara (2007), warna memiliki peran penting yang mendukung terciptanya suasana nyaman dan dapat mempengaruhi psikologis penghuni. Menurut Cahaya Lituhayu, ruang yang ditempati seseorang memiliki pengaruh kuat terhadap kondisi psikologis orang tersebut. Pemilihan warna yang salah dan pemakaian warna yang tidak serasi dapat menyebabkan sebuah ruangan menjadi tidak nyaman (M. Sahid Indraswara, 2007).

(15)

2

disesuaikan dengan kepribadian agar individu yang tinggal di dalamnya merasa nyaman dan betah.

Di dalam dunia kedokteran dan psikologi, William H. Sheldon mengembangkan teori dan konsep mengenai kepribadian yang berakar pada faktor biologi (Alwisol, 2005), salah satu teori tersebut dikenal sebagai teori Hippocrates. Teori Hippocrates membagi manusia menjadi 4 kepribadian, yaitu

Choleric, Melancholic, Phlegmatic, dan Sangunic (Alwisol, 2005).

Masing-masing dari tipe kepribadian manusia tersebut memiliki ciri khas, kekekurangan, kelebihan, dan kebutuhan tersendiri, termasuk kebutuhan akan warna cat dinding yang membuat kamar tidur menjadi nyaman. Berawal dari kebutuhan tersebut, maka diperlukanlah sebuah sistem untuk menjembatani 4 kepribadian manusia yang berbeda agar masing-masing kepribadian tersebut bisa mendapatkan warna cat dinding kamar tidur yang sesuai dengan kepribadian, sehingga bisa menciptakan suasana kamar yang nyaman. Sistem yang dimaksud adalah sebuah sistem yang dapat memberikan rekomendasi pemilihan warna cat dinding sesuai dengan kepribadian manusia.

(16)

3

problem dapat diselesaikan dengan melakukan rekomendasi menggunakan data

demografi yang dimasukkan oleh pengguna ke dalam sistem saat melakukan pendaftaran. Pendekatan dengan cara ini disebut dengan demographic-based

approach (Safoury, dkk, 2013).

Untuk melakukan proses rekomendasi, sistem membutuhkan data latih agar dapat membandingkan apakah Pengguna A cocok dengan X. Prediksi kecocokan dapat diperoleh berdasarkan hasil perbandingan dengan pengguna-pengguna lain yang memiliki kemiripan data demografi dengan pengguna A. Untuk melakukan hal prediksi tersebut, sistem komputer yang dibangun membutuhkan bantuan algoritma. Algoritma yang digunakan adalah algoritma data mining yang bekerja menggali informasi dari data latih yang ada sehingga dapat menghasilkan prediksi warna yang cocok bagi seseorang yang memiliki atribut atau data demografi tertentu.

(17)

4

Algoritma Naive Bayes dan Apriori adalah algoritma yang dapat dimanfaatkan dalam proses klasifikasi data berjenis nominal. Menurut Moh. Nazir (2003), data nominal adalah data yang memiliki ukuran yang paling sederhana, dimana angka yang diberikan kepada objek mempunyai arti sebagai label saja, dan tidak menunjukkan tingkatan apapun, sehingga dapat dikatakan bahwa data-data nominal memiliki tingkat yang setara.

Sebagai dua algoritma klasifikasi yang berbeda, algoritma Naive Bayes dan

Apriori memiliki beberapa perbedaan. Perbedaan di antara kedua algoritma

tersebut dapat diketahui dengan cara melakukan perbandingan. Perbandingan algoritma dapat dilakukan dengan beberapa cara, antara lain dengan cara membandingkan tingkat akurasi dalam memprediksi dan kompleksitas algoritma. Perbandingan algoritma bertujuan untuk mendapatkan algoritma yang dianggap paling baik pada proses klasifikasi suatu permasalahan, karena sebuah algoritma yang dianggap bekerja baik pada kasus A, maka belum tentu bisa menghasilkan hasil klasifikasi yang baik pada kasus B. Maka, diharapkan dengan adanya penelitian dalam perbandingan algoritma Naive Bayes dan Apriori, dapat diketahui algoritma klasifikasi yang baik untuk menyelesaikan masalah pemilihan warna cat dinding kamr tidur berdasarkan kepribadian.

1.2 RUMUSAN MASALAH

(18)

5

berdasarkan kepribadian. Sedangkan rumusan masalah khusus adalah sebagai berikut :

1. Bagaimana implementasi algoritma Naive Bayes untuk sistem pemilihan warna cat dinding kamar tidur sesuai dengan kepribadian?

2. Bagaimana implementasi algoritma Apriori untuk sistem pemilihan warna cat dinding kamar tidur sesuai dengan kepribadian?

3. Bagaimana perbandingan kompleksitas algoritma Naive Bayes dan Apriori? 4. Bagaimana perbandingan hasil akurasi antara algoritma Naive Bayes dan

Apriori?

1.3 TUJUAN PENELITIAN

Tujuan dari penelitian ini adalah membangun sebuah perangkat lunak pemilihan warna cat dinding kamar tidur berdasarkan kepribadian manusia berbasis web untuk mempermudah manusia dalam memilih warna cat dinding untuk kamar tidur sehingga menghasilkan kamar tidur yang nyaman. Adapun tujuan lebih rinci dari penelitian ini adalah sebagai berikut :

1. Dapat mengimplementasikan algoritma Naive Bayes dalam sistem pemilihan warna cat dinding kamar tidur berdasarkan kepribadian.

(19)

6

3. Dapat mengetahui perbandingan kompleksitas di antara algoritma Naive

Bayes dan Apriori dalam sistem pemilihan warna cat dinding kamar tidur berdasarkan kepribadian.

4. Dapat mengetahui perbandingan akurasi di antara algoritma Naive Bayes

dan Apriori dalam sistem pemilihan warna cat dinding kamar tidur

berdasarkan kepribadian.

1.4 BATASAN MASALAH

Untuk memfokuskan penelitian, masalah pada penelitian ini dibatasi sebagai berikut :

1. Tipe kepribadian yang digunakan dalam penelitian ini adalah tipe kepribadian berdasarkan teori kepribadian Hippocrates (tipe kepribadian

Choleric, Sanguinic, Phlegmatic, dan Melancholic).

2. Jenis-jenis warna yang diteliti adalah jenis-jenis warna berdasarkan Teori

Warna Brewster (warna primer, warna sekunder, warna tersier, dan warna

(20)

7

1.5 METODE PENELITIAN

Metode yang digunakan dalam penulisan skripsi ini adalah sebagai berikut :

1.5.1 Tahap Pengumpulan Data

1.5.1.1Studi Literatur

Dalam tahap ini, pengumpulan data dilakukan dengan cara mengumpulkan literatur, jurnal, browsing internet dan bacaan-bacaan lain yang menunjang dan berkaitan dengan topik penelitian baik berupa textbook atau paper.

1.5.1.2Studi Lapangan

Dalam tahap studi lapangan, peneliti mengumpulkan data dengan menganalisis secara langsung permasalahan real yang terjadi pada objek penelitian.

1.5.2 Analisis dan Perancangan Perangkat Lunak

(21)

8

1.5.3 Implementasi Perangkat Lunak

Dalam tahap ini, peneliti akan mulai menerapkan semua hasil rancangan ke dalam bentuk perangkat lunak

1.5.4 Pengujian dan Evaluasi

Tahap ini sekaligus menjadi tahap akhir penelitian. Dalam tahap ini, perangkat lunak yang berhasil dibangun diuji dan dianalisis sejauh mana aplikasi yang dihasilkan dapat menjadi prototipe untuk pengembangan aplikasi sistem pemilihan cat dinding kamar tidur.

1.6 SISTEMATIKA PENULISAN

Sistematika penulisan skripsi ini disusun untuk memberikan gambaran umum tentang tugas akhir dan perangkat lunak yang akan dibuat. Sistematika penulisan tugas akhir ini adalah sebagai berikut :

BAB I PENDAHULUAN

Dalam Bab I akan diuraikan tentang latar belakang masalah, rumusan masalah, maksud dan tujuan, batasan masalah, metode penelitian dan sistematika penulisan.

BAB II KAJIAN PUSTAKA

(22)

9

BAB III METODOLOGI PENELITIAN

Bab ini memaparkan tentang analisis sistem, analisis masalah, analisis yang sedang berjalan, analisis kebutuhan non fungsional, perancangan sistem, perancangan antarmuka dan sebagainya.

BAB IV HASIL PENELITIAN DAN PEMBAHASAN

Pada bab ini akan dibahas secara mendalam berbagai hal yang akan menjawab apa yang sudah dirumuskan dalam rumusan masalah.

BAB V KESIMPULAN DAN SARAN

(23)

40

BAB III

METODOLOGI PENELITIAN

3.1 DESAIN PENELITIAN

Dalam melakukan penelitian, dibutuhkan desain penelitian agar penelitian yang dilakukan dapat berjalan dengan baik. Berikut ini merupakan desain penelitian yang digunakan pada proses rancang bangun aplikasi sistem pemilihan warna cat dinding kamar tidur berdasarkan kepribadian dengan menggunakan algoritma Apriori dan algoritma Naive Bayes.

[image:23.596.116.566.380.695.2]
(24)

41

Desain penelitian ini meliputi :

1. Tahapan Penelitian Awal

a. Menentukan data yang dibutuhkan

Data yang dibutuhkan adalah data demografi yang bersifat nominal atau setara. Data-data tersebut akan digunakan dalam proses klasifikasi data mining. b. Mempersiapkan alat dan bahan penelitian

Alat yang akan digunakan dalam penelitian ini adalah : 1) Laptop dengan spesifikasi:

- Prosesor Intel Core i3 - RAM 2,00 GB

- Harddisk 250 GB 2) Perangkat Lunak :

- Operating System : Windows 7 Professional - Software : XAMPP, NetBeans

(25)

42

2. Studi Literatur

a. Mengumpulkan semua data dan informasi yang dibutuhkan

Metode pengumpulan data yang digunakan adalah random sampling. Pengumpulan data dilakukan dengan cara menyebar survey secara acak hingga jumlah sampel yang dibutuhkan terpenuhi. Survey adalah kegiatan pengumpulan data dari sebagian populasi (penduduk) yang pemilihannya dilakukan dengan menggunakan metode statsitik tertentu sehingga tetap dapat melakukan pendugaan atas populasinya. Untuk menentukan jumlah sampel yang dibutuhkan, digunakan rumus cross sectional sebagai berikut:

Namun, jika besar populasi (N) tidak diketahui, maka besar sampel dihitungan dengan rumus :

Keterangan :

n = jumlah sampel minimal yang diperlukan

Z = score Z, berdasarkan nilai α yang diinginkan α = derajat kepercayaan

(26)

43

p = proporsi kasus yang diteliti dalam populasi, jika p tidak diketahui maka gunakan p terbesar. p terbesar yaitu p = 0.5

1-p = q, yaitu proporsi untuk terjadinya suatu kejadian. Jika penelitian ini

menggunakan p terbesar, maka q = 1-p = 1=0.5

Batas toleransi kesalahan dinyatakan dengan prosentase. Semakin kecil toleransi kesalahan, semakin akurat sampel menggambarkan populasi. Misalnya penelitian dengan batas kesalahan 5% berarti memiliki tingkat akurasi 95%. Pada penelitian ini, ditentukan bahwa batas toleransi kesalahan adalah 5% = 0.05.

[image:26.596.123.499.424.484.2]

Besar nilai Z disesuaikan dengan nilai α :

Tabel 3.1 Besar nilai Z disesuaikan dengan Nilai α

α 1 –α Z1 –α/2 Z1- α

1% 99% 2.58 2.33

5% 95% 1.96 1.64

10% 90% 1.64 1.28

(27)

44

Maka, dari rumus di atas jumlah sampel yang dibutuhkan pada penelitian ini adalah:

n = 4 . 0.5 (1-0.5) 0.052 n = 0.9604

0.0025 n = 384

Jadi, jumlah sampel minimal yang dibutuhkan untuk penelitian ini berjumlah 384 sampel.

Sampel penelitian tersebut akan dijadikan sebagai objek penelitian pada penelitian ini. Sampel penelitian tersebut terdiri dari 4 atribut berjenis data nominal, yaitu dari jenis kelamin, umur, jenis psikologi manusia, dan golongan warna.

b. Mempelajari konsep klasifikasi dalam data mining.

Inti konsep dari data mining adalah menggali dan mendapatkan pengetahuan

(knowledge) dari kumpulan data-data yang ada. Data mining dapat dikategorikan

(28)

45

adalah proses pencarian dalam basis data untuk menemukan pola yang tersembunyi. Discovery dapat dilakukan dengan cara klasifikasi. Pada proses klasifikasi, record-record data yang sebelumnya tidak terlihat dinyatakan kelasnya seakuran mungkin. Pada penelitian skripsi ini, klasifikasi digunakan dalam pemodelan prediktif sehingga dapat memprediksi label kelas untuk record yang belum diketahui kelasnya.

c. Mempelajari konsep algoritma Naive Bayes

Algoritma Naive Bayes merupakan salah satu algoritma yang terdapat pada teknik klasifikasi. Naive Bayes merupakan pengklasifikasian dengan metode probabilitas dan statistik yang dikemukan oleh ilmuwan Inggris Thomas Bayes, yaitu memprediksi peluang di masa depan berdasarkan pengalaman di masa sebelumnya sehingga dikenal sebagai Teorema Bayes. Teorema tersebut dikombinasikan dengan Naive, dimana Naive itu sendiri diasumsikan sebagai kondisi antar atribut saling bebas. Pada proses algoritma Naive Bayes, sejumlah petunjuk yang disebut sebagai atribut diperlukan untuk membantu dalam membentuk kelas yang cocok bagi sampel yang dianalisis.

d. Mempelajari konsep algoritma Apriori

Inti konsep dari algoritma Apriori adalah melakukan pencarian frequent

itemset dengan menggunakan teknik association rule (Erwin, 2009). Algoritma ini

(29)

46

informasi selanjutnya. Pada algoritma Apriori menentukan kandidat yang mungkin muncul dengan cara memperhatikan minimum support dan minimum

confidence. Support adalah nilai pengunjung atau persentase kombinasi sebuah

item dalam database. Sedangkan confidence adalah nilai kepastian yaitu kuatnya

hubungan antar item dalam sebuah Apriori.

e. Mempelajari konsep metode pengembangan perangkat lunak Metode

Waterfall Sequential Linear

Model metode rekayasa perangkat lunak (RPL) ini sering disebut dengan “classic life cycle” atau model waterfall. Karena model ini diperkenalkan pertama

kali pada tahun 70-an maka sering dianggap kuno, tetapi merupakan model yang paling banyak dipakai didalam Software Engineering (SE). Model ini melakukan pendekatan secara sistematis dan urut mulai dari level kebutuhan sistem lalu menuju ke tahap analisis, desain, coding, testing/verification. Disebut dengan

waterfall karena tahap demi tahap yang dilalui harus menunggu selesainya tahap

sebelumnya dan berjalan berurutan. Sebagai contoh tahap desain harus menunggu selesainya tahap sebelumnya yaitu tahap requirement yang terdiri dari tahap-tahap: analisis (analysis), desain (design), kode (code), dan uji coba (test).

3. Data Penelitian

(30)

47

digunakan dalam pengembangan perangkat lunak dengan cara melakukan pembersihan, integrasi, seleksi, dan transformasi data jika diperlukan.

Jika terdapat data yang bersifat interval, maka data tersebut dibuatkan tabel distribusi frekuensi. Fungsi dari tabel distribusi frekuensi adalah agar data yang bersifat interval dapat disajikan dengan baik sehingga dapat dengan mudah dipahami serta dapat memberikan potret yang lebih jelas berkaitan dengan distribusi data. Untuk membuat tabel distribusi frekuensi dapat dilakukan langkah-langkah berikut ini:

a) Urutkan data, biasanya data diurutkan dari nilai yang paling kecil. Tujuan dari pengurutan data ini adalah agar range data dapat diketahui dan mempermudah penghitungan frekuensi tiap kelas.

b) Tentukan range (rentang atau jangkauan). Menentukan range dengan cara mencari selisih antara data terendah dan data tertinggi.

(31)

48

d) Tentukan panjang atau lebar kelas interval (P) :

Keterangan :

P = Panjang kelas interval

R = Rentang (range)

n = Banyak kelas interval

e) Tentukan batas bawah kelas interval pertama.

Tidak ada aturan yang mengikat untuk menentukan nilai batas bawah kelas interval pertama, asalkan nilai terkecil masih masuk ke dalam kelas tersebut.

Maka, dari langkah-langkah di atas dapat diperoleh informasi berupa banyaknya kelas, panjang kelas, dan batas bawah kelas. Dengan informasi-informasi tersebut, maka tabel distribusi frekuensi dapat dibuat.

4. Pengembangan Perangkat Lunak

(32)

49

Desain, Implementasi, Pemeliharaan, dan Pengujian (Analysis, Design, Code, dan

Testing). Proses-proses terstruktur tersebut dapat dijabarkan sebagai berikut.

a. Analisis

Dalam tahap ini dilakukan analisis pembangunan sistem terhadap kebutuhan pengguna, dan kebutuhan perangkat lunak yang meliputi penganalisaan informasi, unjuk kerja, dan antar muka (interface) yang diperlukan.

b. Desain

Pada tahap ini dilakukan perancangan struktur data, arsitektur perangkat lunak, representasi antarmuka, dan algoritma prosedural pada sistem.

c. Code

Tahap ini merupakan fase menterjemahkan model atau desain yang telah ditetapkan kedalamm bahasa yang dimengerti komputer, dalam penelitian ini menggunakan PHP dan MySQL.

d. Test

(33)

50

Gambar 3.2 Metode Waterfall Sequential Linear

Selain itu, pada tahap tes ini juga dilakukan pengujian terhadap tingkat akurasi pada masing-masing algoritma yang diterapkan pada perangkat lunak ini. Untuk melakukan pengukuran tingkat akurasi, akan diberikan 50 data set yang akan diprediksi kelasnya. Dari ke-50 data tersebut akan dihitung seberapa besar prosentase algoritma tersebut merekomendasikan kelas dengan benar.

[image:33.596.143.488.85.232.2]
(34)

96

BAB V PENUTUP

1.1 Kesimpulan

Sistem rekomendasi pemilihan warna cat dinding kamar tidur berdasarkan kepribadian dengan menggunakan algoritma Naive Bayes dan Apriori dapat menjadi salah satu pilihan dalam memecahkan masalah dan kebingungan pengguna dalam memilih cat warna dinding kamar tidur yang sesuai dan cocok bagi pengguna. Dari hasil penelitian ini pula dapat dipenuhi tujuan penelitian, yaitu:

1. Algoritma Naive Bayes dapat diimplementasikan pada sistem pemilihan warna cat dinding kamar tidur sesuai kepribadian.

2. Algoritma Apriori dapat diimplementasikan pada sistem pemilihan warna cat dinding kamar tidur sesuai kepribadian.

3. Algoritma Naive Bayes dan algoritma Apriori yang diterapkan pada penelitan ini memiliki tingkat kompleksitas yang sama. Hal tersebut dihasilkan melalui perhitungan menggunakan Cyclomatic Complexity, dimana didapati bahwa kompleksitas algoritma Apriori = 20 dan kompleksitas algoritma Naive Bayes = 20.

(35)

97

dengan cara menghitung menggunakan metode Confussion Matrix. Dari ke-50 data yang diuji coba, disimpulkan bahwa algoritma Naive Bayes dan

Apriori memiliki tingkat akurasi sebesar 62% dan 58%.

1.2 Saran

Untuk pengembangan penelitian selanjutnya peneliti menyarankan untuk melakukan penelitian pada perbandingan kecepatan proses pada algoritma Naive

Bayes dan Apriori.

(36)

DAFTAR PUSTAKA

Alwisol. (2012) Psikologi Kepribadian. Malang : UMM Press

Choungourian, A. Color Preference and Cultural Variation. American University of Beirut.

Cochran WG. 1997. Sampling Techniques. John Wiley & Sons, Inc.

Darmaprawira, Sulasmi. 2002. Warna: Teori dan Kreativitas Penggunaannya.Bandung: ITB.

Depkes RI. (2009). Profil Kesehatan Indonesia. Jakarta : Departemen Kesehatan Indonesia

Drs. Kuntjojo, M.Pd. 2009. Psikologi Kepribadian. Pendidikan Bimbingan dan Konseling Universitas Nusantara PGRI Kediri.

Febriansyah, John Virlib Lestio, Hendra Tanto. 2008. Autentikasi Tanda Tangan

Dengan Menggunakan Metode Fuzzy C-Means. Binus University.

Indrawarsa, M. Sahid. (2007). Kajian Penempatan Furniture dan Pemakaian

Warna (Studi kasus pada kamar tidur hotel Nugraha Wisata

Bandungan-Ambarawa).

Koeswara, E. 1991. Teori-teori kepribadian.Bandung : Eresco.

Laila Safoury & Akram Salah. 2013. Exploiting User Demographic Attributes for

Solving Cold-Start Problem in Recommender System. Egypt : Cairo

University.

Larose, Daniel T. 2005. Discovering Knowledge In Data: An Introduction to Data

Mining. Jogn Willey & Sons, Inc.

Lituhayu, Cahaya. Pengaruh Warna Terhadap Psikologi Pengguna dalam

(37)

Kursini & Emha Taufiq Luthfi. 2009. Algoritma Data Mining.Yogyakarta : Penerbit Andi.

K.P Soman, Shyam Diwakar, & V. Ajay. Data Mining : Theory and Practice.

Moh. Nazir, Ph.D. Metode Penelitian, Penerbit Ghalia Indonesia, Jakarta, 2003.

Pile, John F. Interior Design. Harry N. Abrams, Inc. New York. 1998.

Shaddiq, Amhar. 2009. Keoptimalan Naive Bayes Dalam Klasifikasi.

Sugiarto, D. Siagian, LT Sunaryanto, DS Oetomo. 2003. Teknik Sampling. Penerbit PT Gramedia Pustaka Utama, Jakarta.

Supranto, J. 2000. Teknik Sampling untuk Survei dan Eksperimen. Penerbit PT Rineka Cipta, Jakarta.

Suyatno, M.Kes. Menghitung Besaran Sampel Penelitian Masyarakat. Bagian/Jurusan Gizi Kesehatan Masyarakat, Fakultas Kesehatan Masyarakat, UNDIP Semarang.

Turban, E., dkk. 2005. Decision Support System and Intellegent Systems. Yogya: Andi Offset.

Universitas Pendidikan Indonesia. (2013). Pedoman Penulisan Karya Ilmiah. Bandung.

Wibowo, Tanjung. S, dkk. Aplikasi Object-Based Image Analysis (OBIA) untuk

Deteksi Perubahan Penggunaan Lahan Menggunakan Citra ALOS

AVNIR-2. Universitas Gajah Mada : Yogyakarta.

Accuracy Assesment. Connecticut, USA : Yale University, diakses pada tanggal

24 Mei 2014, www.yale.edu/ceo/OEFS/Accuracy_Assessment.pdf

Percent Error Formula. Iowa City, USA : Iowa University, diakses pada tanggal

(38)

http://astro.physics.uiowa.edu/ITU/glossary/percent-error-formula/

Pramudiono, Iko., 2006, Apa itu data mining?, diakses pada tanggal 13 Januari 2014,

http://datamining.japati.net/cgi-bin/indodm.cgi?bacaarsip&1155527614&artikel

Pengujian Perangkat Lunak, diakses tanggal 31 Mei 2013

http://ocw.gunadarma.ac.id/course/industrial-technology/informatics-engineering-s1/rekayasa-perangkat- lunak-1/pengujian-perangkat- lunak

Teori Warna Brewster, diakses tanggal 6 September 2013,

http://www.edupaint.com/warna/roda-warna/486-read-110617-teori-warna-brewster.html

Tipe Kepribadian Hippocrates dan Galenus, diakses tanggal 8 September 2013,

http://www.psikologizone.com/tipe-kepribadian-hippocrates-dan-galenus/06511495

Zaine, Osmar. R. 1999. Chapter I: Introduction to Data Mining, University of Alberta, diakses tanggal 30 Mei 2014,

Gambar

Gambar 3.1 Desain Penelitian
Tabel 3.1 Besar nilai Z disesuaikan dengan Nilai α
Gambar 3.2 Metode Waterfall Sequential Linear

Referensi

Dokumen terkait

H1 :Diduga hasil klasifikasi data mining untuk menentukan kelayakan pemberian kredit koperasi menggunakan algoritma Naive bayes memiliki nilai akurasi yang

Algoritma Naive Bayes berbasis Backward Elimination bertujuan untuk melakukan klasifikasi nasabah asuransi dengan hasil akurasi 85,89 % dengan delapan atribut weight

Klasifikasi nantinya akan menerapkan algoritma Naive Bayes, dengan skenario uji dataset menggunakan pembagian persentase (percentage split), yaitu membagi jumlah

Dalam penelitian ini akan dibuat sistem klasifikasi otomatis sentimen komentar menggunakan algoritma Naive Bayes (NB) sehingga proses klasifikasi komentar positif

Dengan melakukan klasifikasi menggunakan Naive Bayes Classifier yaitu algoritma yang melakukan perbandingan probabilitas, dapat dilakukan pengklasifikasian berdasarkan

Alur Klasifikasi 2.5 Model Klasifikasi Metode yang akan digunakan pada penelitian adalah Algoritma C4.5, Random Forest, SVM dan Naive Bayes.. Dalam permodelan ini Algoritma C4.5,

Penelitian kami bertujuan untuk melakukan prediksi klasifikasi kualitas ikan nilem berdasarkan ukuran dengan menggunakan algoritma Naive Bayes.. Prediksi kualitas ikan nilem yang

Grafik ROC algoritma C4.5 dengan lima belas folds Perbandingan Akurasi Naive Bayes dan Algoritma C4.5 Dari hasil pengujian terhadap kedua metode, Naive Bayes memiliki nilai akurasi