PENGEMBANGAN ADAPTIVE WEB SERVER
BERBASIS METODE HIERARCHICAL CLSTERING
PADA DATA LOG WEB SERVER
Yodiar Hellian Y – 5108100165 Dosen Pembimbing :
Waskitho Wibisono, S.Kom, M.Eng, Ph.D Hudan Studiawan, S.Kom, M.Kom
Latar Belakang Masalah
• Web saat ini mengandung informasi yang sangat banyak, diperlukan
suatu cara yang memudahkan pengguna untuk mendapatkan informasi yang benar–benar dia cari dengan mudah dan cepat.
• Berbeda dengan web biasa, website adaptif akan mempelajari
kebiasaan pengguna dan menampilkan suatu halaman web yang sudah diubah sesuai dengan ketertarikan pengguna.
Rumusan Masalah
• Bagaimana mendapatkan informasi dari data yang ada di log web server.
• Bagaimana menggunakan algoritma hierarchical clustering untuk
mendapatkan kelompok-kelompok kelas (cluster) yang mempunyai persamaan dengan batasan tertentu.
Bagaimana menampilkan halaman web yang sudah terpersonalisai
• Bagaimana menampilkan halaman web yang sudah terpersonalisai
dari akses pengguna sehingga dapat ditampilkan informasi dan tautan yang mungkin diinginkan oleh pengguna.
Tujuan
• Untuk membuat dan menerapkan data clustering yang efektif pada web log untuk mendapatkan pola penjelajahan dari pengguna
• Untuk membuat aplikasi yang digunakan pada web server yang
menghasilkan keluaran yang terpersonalisasi dari server.
• Memudahkan pengguna untuk mengakses halaman web sesuai Memudahkan pengguna untuk mengakses halaman web sesuai
Batasan Masalah
• Pembahasan Tugas Akhir ini lebih menitikberatkan pada
perancangan suatu website yang mampu mempersonalisasikan pengguna tanpa perlu mengetahui profil dari pengguna dengan metode hierarchical clustering.
• Website yang digunakan adalah website yang mempunyai struktur web tersusun dengan jelas dan rapi strukturnya.
web tersusun dengan jelas dan rapi strukturnya.
• Untuk komputer jaringan yang mempunyai IP sama, dianggap hanya
ada satu komputer saja yang mengakses web, sehingga hanya ada satu personalisasi pengguna saja.
Data Log Pada Database
Data yang tersimpan pada database
Flowchart
Sistem
Menghitung Jarak Kedekatan
• Diambil contoh menghitung jarak antara tautan
/course/SOCIAL/ECO/index.html dan /course/TECH142/ description.html.
• Bandingkan antara dua string pada dua tautan tersebut dimulai dari
paling depan. String-string tersebut dipisahkan dengan tanda ‘/’.
Untuk tautan course/TECH142/index.html, maka string paling depan Untuk tautan course/TECH142/index.html, maka string paling depan adalah course dan terakhir adalah index.html.
• Beri nilai masing-masing string berdasarkan pada tautan yang
memiliki kedalaman terpanjang. Tautan
/course/SOCIAL/ECO/index.html memiliki kedalaman terdalam yaitu 4. Jadi masing-masing tautan pada string terdepannya berbobot 4 dan akan berkurang 1 pada string berikutnya.
• /course/SOCIAL/ECO/index.html 4/3/2/1 • /course/TECH142/ description.html 4/3/2
• Selanjutnya bandingkan antar string dua tautan tersebut dimulai
dari yang terdepan. Jika panjang string terpanjang mengandung
string terpendek maka nilai bobot string itu akan dijumlahkan. string terpendek maka nilai bobot string itu akan dijumlahkan.
Perbandingan akan dihentikan jika menemukan string yang berbeda.
• Jarak akan didapatkan dari penjumlahan nilai kesamaan string
dibagi dengan total jumlah bobot tautan terpanjang. Dalam contoh
string yang mirip hanya course yang berbobot 4, jadi jarak
kedekatannya
• Jika dua tautan sama sekali berbeda jaraknya adalah 0.0 dan apabila
Antarmuka Sistem
Untuk melihat hasil dari pengelompokan dapat dilihat pada halaman web yang mana menampilkan informasi hasil pengelompokan pada tautan yang diakses dari tiap tiap pengguna
Antar Muka Sistem
Antarmuka Suggestion
Suggestion merupakan suatu fitur yang memudahkan pengguna untuk melihat berita – berita baru yang ada. Berita baru tersebut sudah terpersonalisasi menurut kebiasaan pengguna dengan merujuk pada prosentase hasil pengelompokan yang dilakukan. Suggestion ini akan menampilkan berita yang sesuia dengan kategori paling banyak diakses oleh pengguna. Suggestion yang tampil akan tetap sama disetiap halaman disemua kategori.
Uji Coba dan Evaluasi
Skenario Uji Coba Akurasi Hierarchical Clustering
• Digunakan data sebanyak 50 data tautan yang diakses oleh satu IP. • Hasil clustering akan dicari nilai Dunn Index.
Hasil Pengelompokan IP
10.151.22.134
Data ke- Tautan Cluster 1
1 /refillable/category/Film/Drama.php 2 /refillable/category/Film/Drama/BrilliantLegacy.php 3 /refillable/category/Film/Drama/City.php 4 /refillable/category/Film/Drama/Summer.php 5 /refillable/category/Film/Movie/How2.php 6 /refillable/category/Film/Movie/BrakingDawn2.php 7 /refillable/category/Film/Movie/BrakingDawn2.php 8 /refillable/category/Film/Movie.php 9 /refillable/category/Film/Movie/LaskarPelangi.php 10 /refillable/category/Film/Movie/BankJob.php 11 /refillable/category/Film/Movie/Iron2.php
Data ke- Tautan Cluster 2 1 /refillable/category/Olahraga/GP/MarqezHarusBelajar.php 2 /refillable/category/Olahraga/GP/MarqezHarusBelajar.php 3 /refillable/category/Olahraga/GP.php 4 /refillable/category/Olahraga/GP.php 5 /refillable/category/Olahraga/GP/RosiYamahaLagi.php 6 /refillable/category/Olahraga/GP/HondaBaru.php 7 /refillable/category/Olahraga/GP/klasemenGP.php 8 /refillable/category/Olahraga/GP/HappyRossi.php 9 /refillable/category/Olahraga/GP/HappyRossi.php
Data ke- Tautan Cluster 2 10 /refillable/category/Olahraga.php 11 /refillable/category/Olahraga/Sepak/England.php 12 /refillable/category/Olahraga/Sepak/England.php 13 /refillable/category/Olahraga/Sepak/Liverpool.php 14 /refillable/category/Olahraga/Sepak/TorresTajam.php 15 /refillable/category/Olahraga/Sepak/imbang.php 16 /refillable/category/Olahraga/Sepak/roni.php 17 /refillable/category/Olahraga/Sepak/minder.php 18 /refillable/category/Olahraga/Sepak.php 19 /refillable/category/Olahraga/Sepak.php
Data ke- Tautan Cluster 3 1 /refillable/category/Gosip/Gocip/anang.php 2 /refillable/category/Gosip/Gocip/anang.php 3 /refillable/category/Gosip/Gocip/anang.php 4 /refillable/category/Gosip/Gocip/CitraRihanna.php 5 /refillable/category/Gosip/Gocip/EgiStress.php 6 /refillable/category/Gosip.php 7 /refillable/category/Gosip/Gossip/2pmJakarta.php 8 /refillable/category/Gosip/Gossip/Dragon.php 9 /refillable/category/Gosip/Gossip/LiveBand2pm.php 10 /refillable/category/Gosip/Gossip/YJSberhentirokok.php
Data ke- Tautan Cluster 3 11 /refillable/category/Gosip/Gossip.php 12 /refillable/category/Music/Musik/owlcity.php 13 /refillable/category/Music/Musik/reuniF4.php 14 /refillable/category/Music/Musik/reuniF4.php 15 /refillable/category/Music/Musik/T2Takhny.php 16 /refillable/category/Music/Musik/terbaik.php 17 /refillable/category/Music/Musik/idol.php 18 /refillable/category/Music/Musik/Dewa19.php 19 /refillable/category/Film.php 20 /refillable/category/Music.php
• Keterangan: • = /refillable/category/Film/Drama.php • = /refillable/category/Film/Drama/BrilliantLegacy.php | - | = IntraCluster | - | = • Keterangan: • = /refillable/category/Film/Drama.php • = /refillable/category/Olahraga/GP/MarqezHarusBelajar.php • | - | = InterCluster
Index Dunn
• Penjelasan persamaan: • DI = Dunn Index
• DI = Dunn Index
• d( ) = inter-cluster distance pada cluster i dan j • d(xk) = intra-cluster distance dari cluster k
Uji Coba dan Evaluasi
Evaluasi Uji Coba Suggestion
•
Untuk menguji halaman yang disarankan apakah sudah sesuai
dengan kebiasaan pengguna dengan mengacu pada cluster
terbesar.
•
Memasukkan beberapa data tes berjumlah lima belas data
yang merupakan berita baru.
yang merupakan berita baru.
•
Diantara data tes akan dicari data yang memiliki jarak
Hasil Uji Coba
DATA TES HASIL YANG
DIHARAPKAN HASIL CLUSTERING /category/Olahraga/NBA/RudyGay.php /category/Olahraga/GP/SperpartHonda.php /category/Film/Drama/Missingyou.php /category/Film/Movie/DuaCintaSatuHati.php /category/Gosip/Gocip/Mirzani.php /category/Gosip/Gocip/YodaIdol.php TIDAK TAMPIL TIDAK TAMPIL TIDAK TAMPIL TIDAK TAMPIL TAMPIL TAMPIL TIDAK TAMPIL TIDAK TAMPIL TIDAK TAMPIL TIDAK TAMPIL TAMPIL TAMPIL TAMPIL /category/Gosip/Gossip/KonserSNSD.php /category/Music/Musik/LinkinParkLive.php /category/Music/Kpopmusic/TVXQphp /category/Gosip/Gossip/KonserfuySNSD.php /category/Music/Musik/LinkinghdftydParkLive.p hp /category/Music/Kpopmusic/TVhjgfjyXQphp /category/Olahraga/Sepak/Persebaya.php /category/Olahraga/NBA/TimDuncan.php /category/Olahraga/GP/RossiKeok.php TAMPIL TAMPIL TAMPIL TAMPIL TAMPIL TAMPIL TIDAK TIDAK TIDAK TAMPIL TAMPIL TAMPIL TAMPIL TAMPIL TAMPIL TIDAK TAMPIL TIDAK TAMPIL TIDAK TAMPIL
Kesimpulan
• Aplikasi yang dibangun pada Tugas Akhir ini mampumenghasilkan
keluaran yang terpersonalisasi dari server.
• Dengan adaptif website ini variasi personalisasi dari server dapat
berbeda beda untuk IP yang berbeda.
• Data request URI dapat dignakan untuk data masukkan clustering Data request URI dapat dignakan untuk data masukkan clustering
Kesimpulan
• IP komputer merupakan proyeksi pengguna di mana satu pengguna
hanya menggunakan satu IP.
• Meteode hierarchical clustering yang digunakan mampu
mengkelompokkan kebiasaan pengguna berdasarkan kategorinya.
• Hasil evaluasi untuk akurasi clustering menggunakan metode Dunn Hasil evaluasi untuk akurasi clustering menggunakan metode Dunn Index sebesar 0.93.
• Jumlah IP yang mengakses selama bersamaan mempengaruhi running time aplikasi. Semakin banyak jumlah IP yang mengakses
Saran
• Dari Tugas Akhir yang dibuat, ada beberapa saran untuk
pengembangan sistem. Dari segi metode clustering, untuk meningkatakan akurasi bisa menerapkan metode clustering yang mungkin memiliki performa dan akurasi yang lebih tinggi.