PERBANDINGAN ALGORITMA NAIVE BAYES DAN APRIORI DALAM SISTEM REKOMENDASI PEMILIHAN WARNA CAT DINDING
KAMAR TIDUR BERDASARKAN KEPRIBADIAN
SKRIPSI
Diajukan untuk Memenuhi Sebagian dari Syarat Memperoleh Gelar Sarjana Komputer
Program Studi Ilmu Komputer
Oleh: Juwita Juanda
0801361
PROGRAM STUDI ILMU KOMPUTER
FAKULTAS PENDIDIKAN DAN ILMU PENGETAHUAN ALAM UNIVERSITAS PENDIDIKAN INDONESIA
PERBANDINGAN ALGORITMA NAIVE BAYES DAN APRIORI DALAM SISTEM REKOMENDASI PEMILIHAN WARNA CAT DINDING
KAMAR TIDUR BERDASARKAN KEPRIBADIAN
Oleh Juwita Juanda
0801361
Sebuah skripsi yang diajukan untuk memenuhi salah satu syarat memperoleh gelar Sarjana pada Fakultas Pendidikan Matematika dan Ilmu Pengetahuan Alam
© Juwita Juanda 2014 Universitas Pendidikan Indonesia
Juni 2014
Hak Cipta dilindungi undang-undang.
PERBANDINGAN ALGORITMA NAIVE BAYES DAN APRIORI DALAM SISTEM REKOMENDASI PEMILIHAN WARNA CAT DINDING
KAMAR TIDUR BERDASARKAN KEPRIBADIAN
JUWITA JUANDA 0801361
DISETUJUI DAN DISAHKAN OLEH PEMBIMBING:
Pembimbing I
Rasim, MT
NIP. 197407252006041002
Pembimbing II
Asep Wahyudin, MT NIP. 197112232006041001
Mengetahui
Ketua Program Studi Ilmu Komputer
Rasim, MT
LEMBAR PERNYATAAN
Saya menyatakan bahwa skripsi yang berjudul “Perbandingan Algoritma
Naive Bayes dan Apriori Dalam Sistem Rekomendasi Pemilihan Warna Cat
Dinding Kamar Tidur Berdasarkan Kepribadian” ini sepenuhnya karya saya
sendiri. Tidak ada bagian di dalamnya yang merupakan plagiat dari karya orang lain dan saya tidak memelakukan penjiplakan atau pengutipan dengan cara-cara yang tidak sesuai dengan etika keilmuan yang berlaku dalam masyarakat keilmuan. Atas pernyataan ini, saya siap menanggung resiko/sanksi yang dijatuhkan kepada saya apabila kemudian ditemukan adanya pelanggaran terhadap etika keilmuan dalam karya saya ini.
Bandung, Juni 2014
Yang membuat pernyataan,
ABSTRAK
PERBANDINGAN ALGORITMA NAIVE BAYES DAN APRIORI DALAM SISTEM REKOMENDASI PEMILIHAN WARNA CAT DINDING
KAMAR TIDUR BERDASARKAN KEPRIBADIAN
Juwita Juanda, 0801361, juwitajuanda@gmail.com
Dalam membangun sistem rekomendasi, terdapat beberapa algoritma yang dapat digunakan, antara lain algoritma Naive Bayes dan Apriori. Algoritma Naive
Bayes dan Apriori adalah algoritma yang dapat dimanfaatkan dalam proses
klasifikasi data berjenis nominal. Sebagai dua algoritma klasifikasi yang berbeda, kedua algoritma ini memiliki beberapa perbedaan ataupun persamaan. Perbedaan dan persamaan di antara kedua algoritma tersebut dapat diketahui dengan cara melakukan perbandingan. Perbandingan algoritma dapat dilakukan dengan beberapa cara, antara lain dengan cara membandingkan akurasi dan kompleksitas algoritma. Perbandingan algoritma bertujuan untuk mendapatkan algoritma yang dianggap paling baik pada proses klasifikasi suatu permasalahan, karena sebuah algoritma yang dianggap bekerja baik pada kasus A, maka belum tentu bisa menghasilkan hasil klasifikasi yang baik pada kasus B. Maka, diharapkan dengan adanya penelitian dalam perbandingan algoritma Naive Bayes dan Apriori, dapat diketahui algoritma klasifikasi yang baik untuk menyelesaikan masalah pemilihan warna cat dinding kamr tidur berdasarkan kepribadian.
Kata Kunci : Sistem Rekomendasi, Perbandingan Algoritma, Naive Bayes,
ABSTRACT
COMPARISON OF NAIVE BAYES AND APRIORI ALGORITHM ON RECOMMENDATION SYSTEM FOR CHOOSING BEDROOM PAINT
COLOR BASED ON PERSONALITY
Juwita Juanda, 0801361, juwitajuanda@gmail.com
In building a recommendation systems , there are several algorithms that can be used , there are Naive Bayes algorithm and Apriori algorithm. Naive Bayes and Apriori algorithm are algorithm that can be utilized in the nominal data type classification process. As two different classification algorithms, both of them have some differences and similarities. Differences and similarities between them can be discovered by comparing the both algorithm. Comparison of the algorithm can be done in several ways, such as comparing accuracy and complexity of the algorithms. Comparison algorithm aims to obtain an algorithm that is the best for classiffication process of a problems, because an algorithm that works well on some case, but isn’t works well on another case. Thus, in this research of comparison algorithm Naive Bayes and Apriori , it can be seen that a good classification algorithm to solve the problem wall room paint color selection was based on personality.
DAFTAR ISI
ABSTRAK ...i
ABSTRACT ...ii
KATA PENGANTAR...iii
UCAPAN TERIMAKASIH ...iv
DAFTAR ISI ...vi
DAFTAR TABEL ...ix
DAFTAR GAMBAR ...xi
BAB I PENDAHULUAN ...1
1.1 Latar Belakang ...1
1.2 Rumusan Masalah ...4
1.3 Tujuan Penelitian ...5
1.4 Batasan Masalah ...6
1.5 Metode Penelitian ...6
1.6 Sistematika Penulisan ...8
BAB II KAJIAN PUSTAKA ...10
2.1 Landasan Teori...10
2.1.2 Data Mining ...13
2.1.3 Klasifikasi ...17
2.1.4 Naive Bayes...20
2.1.5 Apriori...22
2.1.6 Data Demografi ...25
2.1.7 Warna ...26
2.1.8 Teori Kepribadian Manusia ...29
2.1.9 Psikologi Warna dalam Interior...31
2.2 Tinjauan Perangkat Lunak ...34
2.2.1 PHP ...34
2.2.2 XAMPP...35
2.2.3 MySQL ...36
2.2.4 Data Flow Diagram (DFD) ...37
2.2.5 Metode Pengembangan Perangkat Lunak ...38
BAB III METODOLOGI PENELITIAN ...39
3.1 Desain Penelitian ...39
BAB IV HASIL PENELITIAN...51
4.1 Hasil Penelitian...51
4.1.2 Hasil Survey ...54
4.2 Implementasi Algoritma ...59
4.2.1 Implementasi Algoritma Naive Bayes ...59
4.2.2 Implementasi Algoritma Apriori ...64
4.3 Perbandingan Algoritma Naive Bayes dan Apriori ...72
4.3.1 Perbandingan Kompleksitas Algoritma ...72
4.3.2 Perbandingan Akurasi ...86
BAB V PENUTUP ...96
5.1 Kesimpulan ...96
5.2 Saran ...97
DAFTAR TABEL Tabel
2.1 Tipe Kepribadian Manusia Berdasarkan Teori Hipocrates ...30
2.2 Komponen Data Flow Diagram ...37
3.1 Besar nilai Z disesuaikan dengan Nilai α ...43
4.1 Kategori Umur Depkes RI Tahun 2009 ...52
4.2 Data Atribut Jenis Kelamin...55
4.3 Data Atribut Tipe Kepribadian ...55
4.4 Data Atribut Golongan Warna ...56
4.5 Hasil Pengurutan Data Atribut Umur ...55
4.6 Informasi yang didapatkan dari Atribut Umur ...58
4.7 Tabel Distribusi Frekuensi Atribut Umur...58
4.8 Kategori Umur Depkes RI Tahun 2009 ...59
4.9 Jumlah Data Atribut Umur Berdasarkan Kategori Umur ...59
4.10 Contoh Data yang akan Diproses dengan Algoritma Naive Bayes ...61
4.11 Hasil Prediksi Menggunakan Algoritma Klasifikasi Naive Bayes...65
4.12 Contoh Data yang akan Diproses dengan Algoritma Apriori ...66
4.13 Proses Pengkategorian ...67
4.14 Pola Kombinasi 2 Itemsets ...70
4.15 Hasil Seleksi Kombinasi Itemsets...70
4.17 Nilai Support, Nilai Confidence, dan Nilai Support x Confidence ...71
4.18 Contoh Data yang akan Diproses dengan Algoritma Apriori ...71
4.19 Data Hasil Perhitungan Algoritma Apriori ...71
4.20 Hasil Prediksi Menggunakan Algoritma Apriori ...72
4.21 Script Algoritma Naive Bayes ...76
4.22 Script Algoritma Apriori ...80
4.23 Hasil Perhitungan Cyclomatic Complexity pada Algoritma Naive Bayes dan Algoritma Apriori...86
4.24 Data Percobaan...87
4.25 Hasil Percobaan dengan 50 Data ...90
4.26 Hasil Prediksi Algoritma Naive Bayes dan Apriori ...92
4.27 Tabel Confussion Matrix Hasil Prediksi Algoritma Naive Bayes ...93
4.28 Producer Accuracy Atribut pada Algoritma Naive Bayes ...93
4.29 User Accuracy Atribut pada Algoritma Naive Bayes ...93
4.30 Tabel Confussion Matrix Hasil Prediksi Algoritma Apriori ...94
4.31 Producer Accuracy Atribut pada Algoritma Apriori ...94
DAFTAR GAMBAR Gambar
2.1 Urutan Langkah Data Mining...17
2.2 Warna Primer ...27
2.3 Warna Sekunder...28
2.4 Warna Tersier...28
2.5 Warna Netral...28
2.6 Metode Waterfall Sequential Linear ...39
3.1 Desain Penelitian ...40
3.2 Metode Waterfall Sequential Linear ...49
4.1 Flowchart Algoritma Naive Bayes ...73
4.2 Flowgraph Algoritma Naive Bayes ...75
4.3 Flowchart Algoritma Apriori ...80
1
BAB 1
PENDAHULUAN
1.1 LATAR BELAKANG
Kamar tidur yang nyaman merupakan dambaan setiap orang. Untuk memperoleh kamar tidur yang nyaman dibutuhkan beberapa sentuhan elemen interior yang dapat menunjang dan meningkatkan rasa nyaman tersebut, salah satunya adalah dengan cara memilih warna cat dinding kamar tidur yang cocok bagi individu yang menempati kamar tidur tersebut.
Menurut Cahaya Lituhayu, ruang yang ditempati seseorang memiliki pengaruh kuat terhadap kondisi psikologis orang tersebut. Menurut M. Sahid Indraswara (2007), warna memiliki peran penting yang mendukung terciptanya suasana nyaman dan dapat mempengaruhi psikologis penghuni. Menurut Cahaya Lituhayu, ruang yang ditempati seseorang memiliki pengaruh kuat terhadap kondisi psikologis orang tersebut. Pemilihan warna yang salah dan pemakaian warna yang tidak serasi dapat menyebabkan sebuah ruangan menjadi tidak nyaman (M. Sahid Indraswara, 2007).
2
disesuaikan dengan kepribadian agar individu yang tinggal di dalamnya merasa nyaman dan betah.
Di dalam dunia kedokteran dan psikologi, William H. Sheldon mengembangkan teori dan konsep mengenai kepribadian yang berakar pada faktor biologi (Alwisol, 2005), salah satu teori tersebut dikenal sebagai teori Hippocrates. Teori Hippocrates membagi manusia menjadi 4 kepribadian, yaitu
Choleric, Melancholic, Phlegmatic, dan Sangunic (Alwisol, 2005).
Masing-masing dari tipe kepribadian manusia tersebut memiliki ciri khas, kekekurangan, kelebihan, dan kebutuhan tersendiri, termasuk kebutuhan akan warna cat dinding yang membuat kamar tidur menjadi nyaman. Berawal dari kebutuhan tersebut, maka diperlukanlah sebuah sistem untuk menjembatani 4 kepribadian manusia yang berbeda agar masing-masing kepribadian tersebut bisa mendapatkan warna cat dinding kamar tidur yang sesuai dengan kepribadian, sehingga bisa menciptakan suasana kamar yang nyaman. Sistem yang dimaksud adalah sebuah sistem yang dapat memberikan rekomendasi pemilihan warna cat dinding sesuai dengan kepribadian manusia.
3
problem dapat diselesaikan dengan melakukan rekomendasi menggunakan data
demografi yang dimasukkan oleh pengguna ke dalam sistem saat melakukan pendaftaran. Pendekatan dengan cara ini disebut dengan demographic-based
approach (Safoury, dkk, 2013).
Untuk melakukan proses rekomendasi, sistem membutuhkan data latih agar dapat membandingkan apakah Pengguna A cocok dengan X. Prediksi kecocokan dapat diperoleh berdasarkan hasil perbandingan dengan pengguna-pengguna lain yang memiliki kemiripan data demografi dengan pengguna A. Untuk melakukan hal prediksi tersebut, sistem komputer yang dibangun membutuhkan bantuan algoritma. Algoritma yang digunakan adalah algoritma data mining yang bekerja menggali informasi dari data latih yang ada sehingga dapat menghasilkan prediksi warna yang cocok bagi seseorang yang memiliki atribut atau data demografi tertentu.
4
Algoritma Naive Bayes dan Apriori adalah algoritma yang dapat dimanfaatkan dalam proses klasifikasi data berjenis nominal. Menurut Moh. Nazir (2003), data nominal adalah data yang memiliki ukuran yang paling sederhana, dimana angka yang diberikan kepada objek mempunyai arti sebagai label saja, dan tidak menunjukkan tingkatan apapun, sehingga dapat dikatakan bahwa data-data nominal memiliki tingkat yang setara.
Sebagai dua algoritma klasifikasi yang berbeda, algoritma Naive Bayes dan
Apriori memiliki beberapa perbedaan. Perbedaan di antara kedua algoritma
tersebut dapat diketahui dengan cara melakukan perbandingan. Perbandingan algoritma dapat dilakukan dengan beberapa cara, antara lain dengan cara membandingkan tingkat akurasi dalam memprediksi dan kompleksitas algoritma. Perbandingan algoritma bertujuan untuk mendapatkan algoritma yang dianggap paling baik pada proses klasifikasi suatu permasalahan, karena sebuah algoritma yang dianggap bekerja baik pada kasus A, maka belum tentu bisa menghasilkan hasil klasifikasi yang baik pada kasus B. Maka, diharapkan dengan adanya penelitian dalam perbandingan algoritma Naive Bayes dan Apriori, dapat diketahui algoritma klasifikasi yang baik untuk menyelesaikan masalah pemilihan warna cat dinding kamr tidur berdasarkan kepribadian.
1.2 RUMUSAN MASALAH
5
berdasarkan kepribadian. Sedangkan rumusan masalah khusus adalah sebagai berikut :
1. Bagaimana implementasi algoritma Naive Bayes untuk sistem pemilihan warna cat dinding kamar tidur sesuai dengan kepribadian?
2. Bagaimana implementasi algoritma Apriori untuk sistem pemilihan warna cat dinding kamar tidur sesuai dengan kepribadian?
3. Bagaimana perbandingan kompleksitas algoritma Naive Bayes dan Apriori? 4. Bagaimana perbandingan hasil akurasi antara algoritma Naive Bayes dan
Apriori?
1.3 TUJUAN PENELITIAN
Tujuan dari penelitian ini adalah membangun sebuah perangkat lunak pemilihan warna cat dinding kamar tidur berdasarkan kepribadian manusia berbasis web untuk mempermudah manusia dalam memilih warna cat dinding untuk kamar tidur sehingga menghasilkan kamar tidur yang nyaman. Adapun tujuan lebih rinci dari penelitian ini adalah sebagai berikut :
1. Dapat mengimplementasikan algoritma Naive Bayes dalam sistem pemilihan warna cat dinding kamar tidur berdasarkan kepribadian.
6
3. Dapat mengetahui perbandingan kompleksitas di antara algoritma Naive
Bayes dan Apriori dalam sistem pemilihan warna cat dinding kamar tidur berdasarkan kepribadian.
4. Dapat mengetahui perbandingan akurasi di antara algoritma Naive Bayes
dan Apriori dalam sistem pemilihan warna cat dinding kamar tidur
berdasarkan kepribadian.
1.4 BATASAN MASALAH
Untuk memfokuskan penelitian, masalah pada penelitian ini dibatasi sebagai berikut :
1. Tipe kepribadian yang digunakan dalam penelitian ini adalah tipe kepribadian berdasarkan teori kepribadian Hippocrates (tipe kepribadian
Choleric, Sanguinic, Phlegmatic, dan Melancholic).
2. Jenis-jenis warna yang diteliti adalah jenis-jenis warna berdasarkan Teori
Warna Brewster (warna primer, warna sekunder, warna tersier, dan warna
7
1.5 METODE PENELITIAN
Metode yang digunakan dalam penulisan skripsi ini adalah sebagai berikut :
1.5.1 Tahap Pengumpulan Data
1.5.1.1Studi Literatur
Dalam tahap ini, pengumpulan data dilakukan dengan cara mengumpulkan literatur, jurnal, browsing internet dan bacaan-bacaan lain yang menunjang dan berkaitan dengan topik penelitian baik berupa textbook atau paper.
1.5.1.2Studi Lapangan
Dalam tahap studi lapangan, peneliti mengumpulkan data dengan menganalisis secara langsung permasalahan real yang terjadi pada objek penelitian.
1.5.2 Analisis dan Perancangan Perangkat Lunak
8
1.5.3 Implementasi Perangkat Lunak
Dalam tahap ini, peneliti akan mulai menerapkan semua hasil rancangan ke dalam bentuk perangkat lunak
1.5.4 Pengujian dan Evaluasi
Tahap ini sekaligus menjadi tahap akhir penelitian. Dalam tahap ini, perangkat lunak yang berhasil dibangun diuji dan dianalisis sejauh mana aplikasi yang dihasilkan dapat menjadi prototipe untuk pengembangan aplikasi sistem pemilihan cat dinding kamar tidur.
1.6 SISTEMATIKA PENULISAN
Sistematika penulisan skripsi ini disusun untuk memberikan gambaran umum tentang tugas akhir dan perangkat lunak yang akan dibuat. Sistematika penulisan tugas akhir ini adalah sebagai berikut :
BAB I PENDAHULUAN
Dalam Bab I akan diuraikan tentang latar belakang masalah, rumusan masalah, maksud dan tujuan, batasan masalah, metode penelitian dan sistematika penulisan.
BAB II KAJIAN PUSTAKA
9
BAB III METODOLOGI PENELITIAN
Bab ini memaparkan tentang analisis sistem, analisis masalah, analisis yang sedang berjalan, analisis kebutuhan non fungsional, perancangan sistem, perancangan antarmuka dan sebagainya.
BAB IV HASIL PENELITIAN DAN PEMBAHASAN
Pada bab ini akan dibahas secara mendalam berbagai hal yang akan menjawab apa yang sudah dirumuskan dalam rumusan masalah.
BAB V KESIMPULAN DAN SARAN
40
BAB III
METODOLOGI PENELITIAN
3.1 DESAIN PENELITIAN
Dalam melakukan penelitian, dibutuhkan desain penelitian agar penelitian yang dilakukan dapat berjalan dengan baik. Berikut ini merupakan desain penelitian yang digunakan pada proses rancang bangun aplikasi sistem pemilihan warna cat dinding kamar tidur berdasarkan kepribadian dengan menggunakan algoritma Apriori dan algoritma Naive Bayes.
[image:23.596.116.566.380.695.2]41
Desain penelitian ini meliputi :
1. Tahapan Penelitian Awal
a. Menentukan data yang dibutuhkan
Data yang dibutuhkan adalah data demografi yang bersifat nominal atau setara. Data-data tersebut akan digunakan dalam proses klasifikasi data mining. b. Mempersiapkan alat dan bahan penelitian
Alat yang akan digunakan dalam penelitian ini adalah : 1) Laptop dengan spesifikasi:
- Prosesor Intel Core i3 - RAM 2,00 GB
- Harddisk 250 GB 2) Perangkat Lunak :
- Operating System : Windows 7 Professional - Software : XAMPP, NetBeans
42
2. Studi Literatur
a. Mengumpulkan semua data dan informasi yang dibutuhkan
Metode pengumpulan data yang digunakan adalah random sampling. Pengumpulan data dilakukan dengan cara menyebar survey secara acak hingga jumlah sampel yang dibutuhkan terpenuhi. Survey adalah kegiatan pengumpulan data dari sebagian populasi (penduduk) yang pemilihannya dilakukan dengan menggunakan metode statsitik tertentu sehingga tetap dapat melakukan pendugaan atas populasinya. Untuk menentukan jumlah sampel yang dibutuhkan, digunakan rumus cross sectional sebagai berikut:
Namun, jika besar populasi (N) tidak diketahui, maka besar sampel dihitungan dengan rumus :
Keterangan :
n = jumlah sampel minimal yang diperlukan
Z = score Z, berdasarkan nilai α yang diinginkan α = derajat kepercayaan
43
p = proporsi kasus yang diteliti dalam populasi, jika p tidak diketahui maka gunakan p terbesar. p terbesar yaitu p = 0.5
1-p = q, yaitu proporsi untuk terjadinya suatu kejadian. Jika penelitian ini
menggunakan p terbesar, maka q = 1-p = 1=0.5
Batas toleransi kesalahan dinyatakan dengan prosentase. Semakin kecil toleransi kesalahan, semakin akurat sampel menggambarkan populasi. Misalnya penelitian dengan batas kesalahan 5% berarti memiliki tingkat akurasi 95%. Pada penelitian ini, ditentukan bahwa batas toleransi kesalahan adalah 5% = 0.05.
[image:26.596.123.499.424.484.2]Besar nilai Z disesuaikan dengan nilai α :
Tabel 3.1 Besar nilai Z disesuaikan dengan Nilai α
α 1 –α Z1 –α/2 Z1- α
1% 99% 2.58 2.33
5% 95% 1.96 1.64
10% 90% 1.64 1.28
44
Maka, dari rumus di atas jumlah sampel yang dibutuhkan pada penelitian ini adalah:
n = 4 . 0.5 (1-0.5) 0.052 n = 0.9604
0.0025 n = 384
Jadi, jumlah sampel minimal yang dibutuhkan untuk penelitian ini berjumlah 384 sampel.
Sampel penelitian tersebut akan dijadikan sebagai objek penelitian pada penelitian ini. Sampel penelitian tersebut terdiri dari 4 atribut berjenis data nominal, yaitu dari jenis kelamin, umur, jenis psikologi manusia, dan golongan warna.
b. Mempelajari konsep klasifikasi dalam data mining.
Inti konsep dari data mining adalah menggali dan mendapatkan pengetahuan
(knowledge) dari kumpulan data-data yang ada. Data mining dapat dikategorikan
45
adalah proses pencarian dalam basis data untuk menemukan pola yang tersembunyi. Discovery dapat dilakukan dengan cara klasifikasi. Pada proses klasifikasi, record-record data yang sebelumnya tidak terlihat dinyatakan kelasnya seakuran mungkin. Pada penelitian skripsi ini, klasifikasi digunakan dalam pemodelan prediktif sehingga dapat memprediksi label kelas untuk record yang belum diketahui kelasnya.
c. Mempelajari konsep algoritma Naive Bayes
Algoritma Naive Bayes merupakan salah satu algoritma yang terdapat pada teknik klasifikasi. Naive Bayes merupakan pengklasifikasian dengan metode probabilitas dan statistik yang dikemukan oleh ilmuwan Inggris Thomas Bayes, yaitu memprediksi peluang di masa depan berdasarkan pengalaman di masa sebelumnya sehingga dikenal sebagai Teorema Bayes. Teorema tersebut dikombinasikan dengan Naive, dimana Naive itu sendiri diasumsikan sebagai kondisi antar atribut saling bebas. Pada proses algoritma Naive Bayes, sejumlah petunjuk yang disebut sebagai atribut diperlukan untuk membantu dalam membentuk kelas yang cocok bagi sampel yang dianalisis.
d. Mempelajari konsep algoritma Apriori
Inti konsep dari algoritma Apriori adalah melakukan pencarian frequent
itemset dengan menggunakan teknik association rule (Erwin, 2009). Algoritma ini
46
informasi selanjutnya. Pada algoritma Apriori menentukan kandidat yang mungkin muncul dengan cara memperhatikan minimum support dan minimum
confidence. Support adalah nilai pengunjung atau persentase kombinasi sebuah
item dalam database. Sedangkan confidence adalah nilai kepastian yaitu kuatnya
hubungan antar item dalam sebuah Apriori.
e. Mempelajari konsep metode pengembangan perangkat lunak Metode
Waterfall Sequential Linear
Model metode rekayasa perangkat lunak (RPL) ini sering disebut dengan “classic life cycle” atau model waterfall. Karena model ini diperkenalkan pertama
kali pada tahun 70-an maka sering dianggap kuno, tetapi merupakan model yang paling banyak dipakai didalam Software Engineering (SE). Model ini melakukan pendekatan secara sistematis dan urut mulai dari level kebutuhan sistem lalu menuju ke tahap analisis, desain, coding, testing/verification. Disebut dengan
waterfall karena tahap demi tahap yang dilalui harus menunggu selesainya tahap
sebelumnya dan berjalan berurutan. Sebagai contoh tahap desain harus menunggu selesainya tahap sebelumnya yaitu tahap requirement yang terdiri dari tahap-tahap: analisis (analysis), desain (design), kode (code), dan uji coba (test).
3. Data Penelitian
47
digunakan dalam pengembangan perangkat lunak dengan cara melakukan pembersihan, integrasi, seleksi, dan transformasi data jika diperlukan.
Jika terdapat data yang bersifat interval, maka data tersebut dibuatkan tabel distribusi frekuensi. Fungsi dari tabel distribusi frekuensi adalah agar data yang bersifat interval dapat disajikan dengan baik sehingga dapat dengan mudah dipahami serta dapat memberikan potret yang lebih jelas berkaitan dengan distribusi data. Untuk membuat tabel distribusi frekuensi dapat dilakukan langkah-langkah berikut ini:
a) Urutkan data, biasanya data diurutkan dari nilai yang paling kecil. Tujuan dari pengurutan data ini adalah agar range data dapat diketahui dan mempermudah penghitungan frekuensi tiap kelas.
b) Tentukan range (rentang atau jangkauan). Menentukan range dengan cara mencari selisih antara data terendah dan data tertinggi.
48
d) Tentukan panjang atau lebar kelas interval (P) :
Keterangan :
P = Panjang kelas interval
R = Rentang (range)
n = Banyak kelas interval
e) Tentukan batas bawah kelas interval pertama.
Tidak ada aturan yang mengikat untuk menentukan nilai batas bawah kelas interval pertama, asalkan nilai terkecil masih masuk ke dalam kelas tersebut.
Maka, dari langkah-langkah di atas dapat diperoleh informasi berupa banyaknya kelas, panjang kelas, dan batas bawah kelas. Dengan informasi-informasi tersebut, maka tabel distribusi frekuensi dapat dibuat.
4. Pengembangan Perangkat Lunak
49
Desain, Implementasi, Pemeliharaan, dan Pengujian (Analysis, Design, Code, dan
Testing). Proses-proses terstruktur tersebut dapat dijabarkan sebagai berikut.
a. Analisis
Dalam tahap ini dilakukan analisis pembangunan sistem terhadap kebutuhan pengguna, dan kebutuhan perangkat lunak yang meliputi penganalisaan informasi, unjuk kerja, dan antar muka (interface) yang diperlukan.
b. Desain
Pada tahap ini dilakukan perancangan struktur data, arsitektur perangkat lunak, representasi antarmuka, dan algoritma prosedural pada sistem.
c. Code
Tahap ini merupakan fase menterjemahkan model atau desain yang telah ditetapkan kedalamm bahasa yang dimengerti komputer, dalam penelitian ini menggunakan PHP dan MySQL.
d. Test
50
Gambar 3.2 Metode Waterfall Sequential Linear
Selain itu, pada tahap tes ini juga dilakukan pengujian terhadap tingkat akurasi pada masing-masing algoritma yang diterapkan pada perangkat lunak ini. Untuk melakukan pengukuran tingkat akurasi, akan diberikan 50 data set yang akan diprediksi kelasnya. Dari ke-50 data tersebut akan dihitung seberapa besar prosentase algoritma tersebut merekomendasikan kelas dengan benar.
[image:33.596.143.488.85.232.2]96
BAB V PENUTUP
1.1 Kesimpulan
Sistem rekomendasi pemilihan warna cat dinding kamar tidur berdasarkan kepribadian dengan menggunakan algoritma Naive Bayes dan Apriori dapat menjadi salah satu pilihan dalam memecahkan masalah dan kebingungan pengguna dalam memilih cat warna dinding kamar tidur yang sesuai dan cocok bagi pengguna. Dari hasil penelitian ini pula dapat dipenuhi tujuan penelitian, yaitu:
1. Algoritma Naive Bayes dapat diimplementasikan pada sistem pemilihan warna cat dinding kamar tidur sesuai kepribadian.
2. Algoritma Apriori dapat diimplementasikan pada sistem pemilihan warna cat dinding kamar tidur sesuai kepribadian.
3. Algoritma Naive Bayes dan algoritma Apriori yang diterapkan pada penelitan ini memiliki tingkat kompleksitas yang sama. Hal tersebut dihasilkan melalui perhitungan menggunakan Cyclomatic Complexity, dimana didapati bahwa kompleksitas algoritma Apriori = 20 dan kompleksitas algoritma Naive Bayes = 20.
97
dengan cara menghitung menggunakan metode Confussion Matrix. Dari ke-50 data yang diuji coba, disimpulkan bahwa algoritma Naive Bayes dan
Apriori memiliki tingkat akurasi sebesar 62% dan 58%.
1.2 Saran
Untuk pengembangan penelitian selanjutnya peneliti menyarankan untuk melakukan penelitian pada perbandingan kecepatan proses pada algoritma Naive
Bayes dan Apriori.
DAFTAR PUSTAKA
Alwisol. (2012) Psikologi Kepribadian. Malang : UMM Press
Choungourian, A. Color Preference and Cultural Variation. American University of Beirut.
Cochran WG. 1997. Sampling Techniques. John Wiley & Sons, Inc.
Darmaprawira, Sulasmi. 2002. Warna: Teori dan Kreativitas Penggunaannya.Bandung: ITB.
Depkes RI. (2009). Profil Kesehatan Indonesia. Jakarta : Departemen Kesehatan Indonesia
Drs. Kuntjojo, M.Pd. 2009. Psikologi Kepribadian. Pendidikan Bimbingan dan Konseling Universitas Nusantara PGRI Kediri.
Febriansyah, John Virlib Lestio, Hendra Tanto. 2008. Autentikasi Tanda Tangan
Dengan Menggunakan Metode Fuzzy C-Means. Binus University.
Indrawarsa, M. Sahid. (2007). Kajian Penempatan Furniture dan Pemakaian
Warna (Studi kasus pada kamar tidur hotel Nugraha Wisata
Bandungan-Ambarawa).
Koeswara, E. 1991. Teori-teori kepribadian.Bandung : Eresco.
Laila Safoury & Akram Salah. 2013. Exploiting User Demographic Attributes for
Solving Cold-Start Problem in Recommender System. Egypt : Cairo
University.
Larose, Daniel T. 2005. Discovering Knowledge In Data: An Introduction to Data
Mining. Jogn Willey & Sons, Inc.
Lituhayu, Cahaya. Pengaruh Warna Terhadap Psikologi Pengguna dalam
Kursini & Emha Taufiq Luthfi. 2009. Algoritma Data Mining.Yogyakarta : Penerbit Andi.
K.P Soman, Shyam Diwakar, & V. Ajay. Data Mining : Theory and Practice.
Moh. Nazir, Ph.D. Metode Penelitian, Penerbit Ghalia Indonesia, Jakarta, 2003.
Pile, John F. Interior Design. Harry N. Abrams, Inc. New York. 1998.
Shaddiq, Amhar. 2009. Keoptimalan Naive Bayes Dalam Klasifikasi.
Sugiarto, D. Siagian, LT Sunaryanto, DS Oetomo. 2003. Teknik Sampling. Penerbit PT Gramedia Pustaka Utama, Jakarta.
Supranto, J. 2000. Teknik Sampling untuk Survei dan Eksperimen. Penerbit PT Rineka Cipta, Jakarta.
Suyatno, M.Kes. Menghitung Besaran Sampel Penelitian Masyarakat. Bagian/Jurusan Gizi Kesehatan Masyarakat, Fakultas Kesehatan Masyarakat, UNDIP Semarang.
Turban, E., dkk. 2005. Decision Support System and Intellegent Systems. Yogya: Andi Offset.
Universitas Pendidikan Indonesia. (2013). Pedoman Penulisan Karya Ilmiah. Bandung.
Wibowo, Tanjung. S, dkk. Aplikasi Object-Based Image Analysis (OBIA) untuk
Deteksi Perubahan Penggunaan Lahan Menggunakan Citra ALOS
AVNIR-2. Universitas Gajah Mada : Yogyakarta.
Accuracy Assesment. Connecticut, USA : Yale University, diakses pada tanggal
24 Mei 2014, www.yale.edu/ceo/OEFS/Accuracy_Assessment.pdf
Percent Error Formula. Iowa City, USA : Iowa University, diakses pada tanggal
http://astro.physics.uiowa.edu/ITU/glossary/percent-error-formula/
Pramudiono, Iko., 2006, Apa itu data mining?, diakses pada tanggal 13 Januari 2014,
http://datamining.japati.net/cgi-bin/indodm.cgi?bacaarsip&1155527614&artikel
Pengujian Perangkat Lunak, diakses tanggal 31 Mei 2013
http://ocw.gunadarma.ac.id/course/industrial-technology/informatics-engineering-s1/rekayasa-perangkat- lunak-1/pengujian-perangkat- lunak
Teori Warna Brewster, diakses tanggal 6 September 2013,
http://www.edupaint.com/warna/roda-warna/486-read-110617-teori-warna-brewster.html
Tipe Kepribadian Hippocrates dan Galenus, diakses tanggal 8 September 2013,
http://www.psikologizone.com/tipe-kepribadian-hippocrates-dan-galenus/06511495
Zaine, Osmar. R. 1999. Chapter I: Introduction to Data Mining, University of Alberta, diakses tanggal 30 Mei 2014,