Gambar 4.7 Detail Rekomendas
4.4 Pengujian Data
Data yang digunakan di dalam penelitian dapat dikategorikan menjadi beberapa bagian, yaitu :
Data Software Antivirus
Data mengenai software antivirus dikoleksi dari berbagai sumber di internet seperti halaman web maupun majalah online. Jumlah data software antivirus yang dipakai di dalam penelitian ini adalah 116 buah.
Data Pengguna
Penulis menggunakan metode pengujian secara langsung dengan melibatkan pengguna, baik yang ahli dibidang IT (untuk membentuk rating yang bermutu), maupun pengguna awam. Data pengguna yang berhasil dikumpulkan berjumlah 108 buah.
Content / fitur yang dapat dimiliki oleh satu buah software antivirus berjumlah 19 buah, yaitu : Anti Rootkit, Anti-Spam, Anti-Spyware, Anti-Virus Protection, Automatic Updates, Boot Time Scan, Bot Blocker, Email Protection, Firewall, Malware Protection, Parental Control, Real Time Protection, Trojan Protection, Two-way Firewall, Web Protection, Worm Protection, Anti-Dialer, Keylogger, dan Phising Protection.
Kriteria yang dapat diberi rating di dalam sebuah software antivirus berjumlah 4 buah, yaitu : Performance, Detection, Updates, dan Technical Support.
4.4.4. Persiapan Pengujian Data
Untuk menguji kebenaran rekomendasi yang dihasilkan oleh program dengan metode hybrid pada sistem rekomendasi dengan multi-criteria rating, penulis akan membuat sebuah skenario penggunaan sistem rekomendasi dan membandingkan perhitungan manual dengan perhitungan yang dihasilkan oleh program.
Berikut merupakan rincian skenario pengujian data pada sistem rekomendasi
software antivirus dengan multi-criteria rating :
1. Nama Pengguna : Good Day ( 114)
2. ID Pengguna : 114
3. Antivirus yang diberi rating olehnya :
Tabel 4.6 Antivirus yang Sudah Pernah Diberi Rating ID Nama Software
Antivirus
Fitur Yang
Dimiliki Rating Gambar
12 Kaspersky Internet Security Anti-Spam, Automatic Updates, Firewall, Malware Protection, Two-way Firewall, Keylogger, Phising Protection Performance :5 Detection:5 Updates:5 TechSupport:3 11 McAffee Total Protection Anti-Spam, Anti- Spyware, Anti-Virus Protection, Automatic Updates, Email Protection, Firewall, Real Time Protection, Web Protection
Performance:5 Detection: 4 Updates: 4 Tech Support: 2
27 Avira Free Antivirus Anti-Virus Protection Email Protection, Firewall Performance:4 Detection:2 Updates:2 Tech Support:1
20 Panda Antivirus Pro Anti-Spam, Anti- Spyware, Anti-Virus, Automatic Updates, Firewall, Trojan Protection, Worm Protection Performance:3 Detection:2 Updates:2 Tech Support:2
Tabel 4.6 menjelaskan antivirus apa saja yang telah pengguna 114 berikan kepada sistem. Sedangkan tabel 4.7 menggambarkan sebuah software antivirus yang akan diprediksi ratingnya :
Tabel 4.7 Antivirus yang akan Diprediksi Ratingnya ID Nama Software
Antivirus
Fitur Yang
Dimiliki Prediksi Rating Gambar 23 Norton Antivirus Anti-rootkit, Anti-
Spyware, Anti-Virus, boot-time, bot blocker, email protect,malware protect, real time protect, trojan protect web protect,worm protect, phising protect
?
Untuk memudahkan perhitungan nantinya, dibentuklah sebuah tabel yang lebih ringkas.
Tabel 4.8 yang Sudah Pernah Diberi Rating (sederhana)
ID Nama Software Antivirus Fitur Yang Dimiliki Rating (multi-criteria) 12 Kaspersky Internet Security 2,5,9,10,14,18,19 5,5,5,3
11 McAffee Total Protection 2,3,4,5,8,9,12,15 5,4,4,2
27 Avira Free Antivirus 4,8,9 4,2,2,1
20 Panda Antivirus Pro 2,3,4,5,9,13,16 3,2,2,2
Tabel 4.9 Antivirus yang akan Diprediksi Ratingnya (sederhana) ID Nama Software Antivirus Fitur Yang Dimiliki Prediksi Rating 23 Norton Antivirus 1,3,4,6,7,8,10,12,
13,15,16,19
?
4.4.2. Perhitungan Content Based
Pertama-tama, hitung prediksi rating dengan menggunakan metode content based. Untuk rating kriteria pertama, tabel item feature-nya adalah sebagai berikut :
Tabel 4.10 Item Feature 114 utk kriteria rating pertama � � � � � � � � � � � � � � � � � � � R 0 1 0 0 1 0 0 0 1 1 0 0 0 1 0 0 0 1 1 5 0 1 1 1 1 0 0 1 1 0 0 1 0 0 1 0 0 0 0 5 0 0 0 1 0 0 0 1 1 0 0 0 0 0 0 0 0 0 0 4 0 1 1 1 1 0 0 0 1 0 0 0 1 0 0 1 0 0 0 3
Tabel 4.10 adalah tabel item feature yang dimiliki seorang pengguna 114 (untuk kriteria rating pertama). Kemudian, hitung bobot pengguna terhadap masing-masing fitur dengan menggunakan rumus (2.1).
114, 1 =1 4∗ 0∗5 + 0∗5 + 0∗2 + 0∗3 = 0 114, 2 =1 4∗ 1∗5 + 1∗5 + 0∗2 + 1∗3 =3.25 114, 3 =1 4∗ 0∗5 + 1∗5 + 0∗2 + 1∗3 = 2 114, 4 =1 4∗ 0∗5 + 1∗5 + 1∗4 + 1∗3 = 3 114, 5 =1 4∗ 1∗5 + 1∗5 + 0∗2 + 1∗3 = 3.25 dan seterusnya.
Untuk lebih lengkapnya, bobot pengguna terhadap masing-masing fitur (untuk kriteria rating pertama) dapat dijelaskan pada tabel 4.11.
Tabel 4.11 Hasil Perhitungan Bobot dengan Cara Manual
� � � � � � � � � � � � � � � � � � �
0 3.25 2 3 3.25 0 0 2.25 4.25 1.25 0 1.25 0.75 1.25 1.25 0.75 0 1.25 1.25
Gambar 4.11 adalah hasil perhitungan bobot yang dihasilkan oleh sistem rekomendasi software antivirus untuk keempat kriteria rating. Bagian yang dimerahi adalah hasil perhitungan bobot untuk kriteria rating pertama.
Gambar 4.11 Perhitungan Bobot dengan Menggunakan Sistem
Kemudian, prediksi rating antivirus dengan menggunakan rumus (2.2) (metode
�′ (
114, 23) = ((1∗0) + (1∗2) + (1∗3) + (1∗0) + (1∗0) + (1∗2.25) + (1∗
1.25) + (1∗1.25) + (1∗0.75) + (1∗1.25) + (1∗0.75) + (1∗1.25))/12
�′ ( , ) = .
Gambar 4.12 adalah gambar yang menunjukkan hasil perhitungan prediksi rating
content based yang dihasilkan oleh sistem rekomendasi software antivirus.
Gambar 4.12 Perhitungan Prediksi Content Based dengan Menggunakan Sistem
Dengan melihat gambar 4.12 penulis dapat mengatakan bahwa hasil yang diperoleh dengan menghitung secara manual dengan hasil yang diperoleh dari sistem sama. Oleh karena itu, penulis dapat mengambil kesimpulan bahwa implementasi metode content based di dalam sistem rekomendasi software antivirus sudah dilakukan dengan benar.
4.4.3. Perhitungan Collaborative Filtering
Setelah didapat hasil perhitungan prediksinya dengan menggunakan content based, hitung prediksi rating dengan menggunakan metode collaborative filtering. Tabel 4.12 merupakan matrix rating antara pengguna 114 dengan pengguna lain yang mirip (neighbor).
Tabel 4.12 Matrix Rating User x Itemutk Kriteria Rating Pertama ID 5 5 3 4 ? 4 4 - 4 4 3 5 - 3 5 - 4 3 1 4 - 5 4 - 5 5 - - 2 3 4 - - 2 3 - 5 - - 3
Kemudian, hitung kemiripan antara 114 dengan semua pengguna neighbor
tersebut dengan menggunakan rumus cosine based similiarity (2.4).
114, 3 = 5∗4+5∗4+4∗4 52+52+42∗ 42+42+42 = 0.995 114, 4 = 5∗3+5∗5+4∗3 52+52+42∗ 32+52+32= 0.976 114, 9 = 5∗4+3∗3+4∗1 52+32+42∗ 42+32+12 = 0.915 114, 10 = 5∗5+3∗4 52+32∗ 42+32 = 0.991 114, 12 = 5∗5+4∗2 52+52∗ 42+22 = 0.957 114, 13 = 5∗4+4∗2 52+42∗ 42+22 = 0.978 114, 20 = 5∗5 52∗ 52= 1.000
Gambar 4.13 merupakan hasil perhitungan kemiripan yang dilakukan oleh sistem rekomendasi software antivirus yang dibangun.
Gambar 4.13 Perhitungan Kemiripan Pengguna pada Sistem Rekomendasi
Kemudian, hitung prediksi rating terhadap software antivirus tersebut dengan menggunakan rumus weighted sum (2.3).
�′
114, 23 =
0.995∗4+0.976∗5+0.915∗4+0.991∗5+0.957∗3+0.978∗3+1∗3 0.995+0.976+0.915+0.991+0.957+0.978+1
�′� , = .
Sedangkan prediksi rating secara collaborative filtering yang dihasilkan oleh sistem rekomendasi yang dibangun dijelaskan pada gambar 4.14.
Dengan melihat gambar 4.14 penulis dapat mengatakan bahwa hasil yang diperoleh dengan menghitung secara manual dengan hasil yang diperoleh dari sistem sama. Oleh karena itu, penulis dapat mengambil kesimpulan bahwa implementasi metode
collaborative filtering di dalam sistem rekomendasi software antivirus sudah dilakukan dengan benar.
4.4.3. Perhitungan Secara Hybrid
Berikut ini merupakan hasil perhitungan yang dilakukan oleh dua buah metode
content based dan collaborative filtering.
Content Based
�′ (
114, 23) = 1.146
Collaborative Filtering
�′ 114, 23 = 3.858
Maka hasil perhitungan secara hybrid (linear combination) yang diharapkan dapat dihitung dengan mengggunakan rumus (2.5) (menggunakan bobot yang sama untuk kedua metode tersebut).
�′ 114, 23 = (1.146 + 3.858)/2
�′� , = .
Sedangkan hasil perhitungan secara hybrid (linear combination) yang dihasilkan oleh sistem rekomendasi software antivirus dijelaskan pada gambar 4.15.
Gambar 4.15 Hasil Perhitungan Hybrid oleh Sistem Rekomendasi Antivirus
Dengan melihat gambar 4.15 penulis dapat mengatakan bahwa hasil yang diperoleh dengan menghitung secara manual dengan hasil yang diperoleh dari sistem sama. Oleh karena itu, penulis dapat mengambil kesimpulan bahwa implementasi metode hybrid
(content based dan collaborative filtering) di dalam sistem rekomendasi software antivirus sudah dilakukan dengan benar.
4.4.5. Penggabungan Kriteria Rating
Prediksi rating yang dibahas sebelumnya adalah prediksi rating untuk kriteria pertama. Dengan melakukan cara yang sama seperti di atas, penulis dapat menghitung prediksi rating untuk tiga kriteria rating lainnya dengan rangkuman sebagai berikut.
Prediksi rating untuk kriteria pertama
�1′ 114, 23 = 2.502
Prediksi rating untuk kriteria kedua
�2′ 114, 23 = 2.651
Prediksi rating untuk kriteria ketiga
�3′ 114, 23 = 2.650
Prediksi rating untuk kriteria keempat
�4′ 114, 23 = 2.267
Berdasarkan penelitian yang dilakukan oleh Castelli J. (2001), maka penulis mampu menyimpulkan kriteria apa saja yang harus dimiliki oleh sebuah software
antivirus (lihat bab 2). Prediksi rating keseluruhan dapat dihitung dengan
menggunakan rumus (2.7). �′ 114, 23 = 3∗2.502 + 2∗2.651 + 2∗2.650 + 1∗2.267 3 + 2 + 2 + 1 �� �′ , = .
Sedangkan perhitungan penggabungan / agregasi multi-criteria rating yang dihasilkan oleh sistem rekomendasi digambarkan pada gambar 4.16.
Gambar 4.16 Penggabungan Kriteria Rating oleh Sistem Rekomendasi
Setelah melakukan uji coba data secara bertahap dan terperinci, penulis dapat mengambil kesimpulan bahwa sistem rekomendasi software antivirus sudah diimplementasikan dengan benar.
BAB 5