10 3 Nilai fuzzy support bagi frequent
sequence dengan ukuran k diperoleh dengan mengkombinasikan frequent sequence dengan ukuran k-1. Proses ini akan berhenti jika tidak memungkinkan lagi untuk membangkitkan kandidat pola sekuensial dengan ukuran k+1. Tahapan algoritma Totally Fuzzy secara lengkap dapat dilihat pada Lampiran 1.
5. Analisis Pola
Pada tahap ini akan dianalisis pola sekuensial mana yang dikatakan frequent sequence dan mewakili pola pengaksesan pengguna.
6. Representasi pengetahuan
Pola sekuensial yang telah ditemukan kemudian dipresentasikan kepada pengguna agar mudah dipahami dan diinterpretasikan. Lingkungan Pengembangan Sistem
Spesifikasi perangkat keras dan perangkat lunak yang digunakan dalam pengembangan sistem adalah sebagai berikut :
a. Perangkat keras dengan spesifikasi :
• Processor : Intel(R) Core(TM) 2 Duo
• Memory : 1 GB
• Harddisk : 160 GB
• Monitor 12.1” WXGA dengan resolusi 1024 x 768 pixel
• Alat input : mouse dan keyboard b. Perangkat lunak yang digunakan :
• Sistem Operasi : Microsoft Windows XP Professional dan Linux Ubuntu Feasty Fawn 7.10
• Microsoft Excel 2007 sebagai lembar kerja (worksheet) dalam pengolahan data.
• Matlab 7.0.1 sebagai bahasa pemrograman.
• GAWK sebagai media yang digunakan untuk praprosesdata.
HASIL DAN PEMBAHASAN
Data yang digunakan dalam penelitian ini adalah data log akses server web situs web IPB (www.ipb.ac.id). Data tesebut merupakan data pada server web IPB selama periode waktu 5 Januari hingga 18 Juni 2007 yang diperoleh
dalam bentuk file Common Log Format (CLF). Deskripsi data tersebut dapat dilihat pada Lampiran 2.
Sebelum di-mining, data harus melewati tahap praproses (preprocessing) terlebih dahulu yang meliputi pembersihan data, transformasi data, dan seleksi data. Hal ini dilakukan agar data benar-benar lengkap, valid, dan sesuai dengan masukkan yang dibutuhkan oleh algoritma.
Pembersihan Data
Pada tahap ini dilakukan proses pembersihan terhadap data, data yang dibuang dan tidak diikutsertakan dalam tahap berikutnya, yaitu : 1. Data yang mencatat request terhadap
resource data citra, yaitu jpg, png dan gif yang berukuran < 6 KB. Data citra yang berukuran > 6 KB dianggap merupakan sebuah konten dari halaman situs web dan bukan data yang hanya merupakan data pelengkap dari sebuah halaman situs web. 2. Datayang mencatat proses request terhadap
data css, emz, ico, js, robots, swf, vbs, cgi, exe dan template.
3. Data yang mencatat kode status 401, 403, dan 404. Kode status 401, 403, dan 404 menunjukkan bahwa terjadi kegagalan (failed) dalam proses request. Kode status 401 menunjukkan bahwa terjadi kegagalan dalam proses autentifikasi, kode status403 menunjukkan bahwa terdapat suatu larangan tertentu dalam proses request (forbidden request) terhadap subdirektori yang diminta oleh pengguna, dan kode status 404 menunjukkan bahwa file yang diminta oleh pengguna tidak ditemukan pada server (file not found).
Data yang diikutsertakan dalam tahap selanjutnya, yaitu :
1. Data yang mencatat kode status200. Kode status 200 mengindikasikan bahwa request berhasil dilakukan dan server web mengirimkan halaman situs yang diminta kepada pengguna.
2. Data yang mencatat request terhadap sebuah halaman situs web.
Pada tahap ini dihasilkan koleksi data yang valid dan sesuai dengan input yang dibutuhkan oleh algoritma Totally Fuzzy. Setelah dilakukan proses pembersihan data maka diperoleh data
11 bersih sebanyak 2.268.596 record yang terdiri
atas 25.162 record yang berasal dari pengguna internal dan 2.243.434 record yang berasal dari pengguna eksternal. Contoh data yang telah melalui tahap pembersihan data ditunjukkan pada Lampiran 3.
Seleksi Data
Koleksi data log akses server web IPB yang tersedia kemudian diseleksi untuk mendapatkan data yang akan di-mining.
Prosedur yang dilakukan pada tahap seleksi data adalah sebagai berikut :
1. Memilih tiga atributdari tujuh atributyang tersedia. Pada log akses tercatat tujuh buah atribut. Namun atributyang akan digunakan sebagai masukkan bagi algoritma Totally Fuzzy hanya tiga atribut, yaitu remotehost / alamat IP, date atau tanggal terjadinya proses pengaksesan, dan URL yang diakses oleh pengguna.
2. Melakukan pemisahan data yang mencatat request dari pengguna yang berasal dari internal dan eksternal IPB. Untuk dapat mengetahui bahwa request tersebut berasal dari internal maupun eksternal IPB dapat dilihat dari remotehost / alamat IP server proxy masing-masing pengguna. Alamat IP dari server proxy kelompok pengguna yang berasal dari internal IPB, yaitu berkisar di antara 10.x.x.x s/d 10.255.255.255 (class A), 172.16-18.x.x s/d 172.32.x.x (class B), 192.168.0.0 s/d 192.168.255.255 (class C) dan 118.97.49.x, sedangkan alamat IP dari proxy selain alamat IP dari server proxy yang termasuk ke dalam kelompok pengguna internal akan dianggap sebagai kelompok pengguna eksternal.
Transformasi Data
Pada tahap ini dilakukan beberapa proses transformasi data, yaitu :
1. Proses konversi format data yang sesuai untuk digunakan sebagai masukkan algoritma. Data yang semula terdapat dalam bentuk Common Log Format (CLF) kemudian ditransformasikan terlebih dahulu ke dalam format text (*.txt) dan selanjutnya diubah ke dalam format data Microsoft Excel (*.xlsx). Data dalam format *.xlsx inilah yang kemudian akan digunakan
sebagai masukkan bagi algoritma Totally Fuzzy.
2. Data dikelompokkan berdasarkan alamat IP masing-masing pengguna. Kemudian data diurutkan berdasarkan hari pengaksesan serta dilakukan penghitungan banyaknya pengaksesan terhadap masing-masing halaman situs web bagi tiap pengguna. Setelah melalui tahapan tersebut maka untuk kelompok pengguna internal terdapat 572 baris data dengan 54 alamat IP yang berbeda, sedangkan untuk kelompok pengguna eksternal terdapat sebanyak 393.622 baris data dengan 30.269 alamat IP yang berbeda.
3. Proses konversi atribut ke dalam bentuk numerik. Atribut tanggal yang semula berformat date ditransformasikan ke dalam bentuk numerik (datenum). Selain itu, alamat IP dan URL dinotasikan ke dalam bentuk numerik dengan kode yang bersifat unik. Format data tersebut dapat dilihat pada Lampiran 4 dan 5. Hal tersebut dilakukan agar lebih sederhana dan mempermudah proses komputasi terhadap data. Alamat IP dikonversikan ke dalam bentuk numerik dengan menggunakan rumus sebagai berikut :
(5) Simbol w, x, y dan z menggambarkan digit pada alamat IP yang dipisahkan oleh tanda titik. Nilai maksimum w, x ,y dan z adalah 255, yang menunjukkan nilai maksimum digit angka pada alamat IP. 4 Data ditransfomasi ke dalam bentuk
himpunan fuzzy yang memiliki nilai berkisar antara 0 dan 1. Pada tahap ini digunakan metode Fuzzy C-Means untuk membentuk fungsi keanggotaan. Fungsi keanggotaan tersebut dibentuk berdasarkan data yang diperoleh bagi masing-masing halaman situs web.Masing-masing halaman situs web dipartisi ke dalam tiga fuzzy set, yaitu yang memiliki frekuensi pengaksesan rendah, sedang dan tinggi. Dari data tercatat 41 halaman situs web yang diakses oleh pengguna internal dan 48 halaman situs web yang diakses pengguna eksternal. Bagi masing-masing halaman situs web tersebut akan dibentuk fungsi keanggotaan (membership function) sehingga didapatkan nilai derajat keanggotaan bagi
12 masing frekuensi pengaksesan. Gambar 7(a)
dan 7(b) menunjukkan fungsi keanggotaan halaman home bagi data pengguna internal dan eksternal.
Gambar 7(a) dan 7(b) adalah fungsi keanggotaan halaman home bagi data pengguna internal dan eksternal.
Web Mining
Tahapan web mining diterapkan dengan menggunakan metode Totally Fuzzy (Fiot. C et al 2005) untuk membentuk semua kemungkinan frequent sequence. Secara garis besar, proses ini dibagi menjadi 2 bagian, yaitu melakukan proses komputasi untuk mendapatkan nilai fuzzy support bagi masing-masing fuzzy item dan hanya item dengan nilai support lebih besar dari nilai minimum support yang akan disimpan sebagai frequent sequence berukuran satu. Kemudian melakukan proses pembentukan kandidat pola sekuensial berukuran k yang didapatkan dari kombinasi frequent sequence berukuran k-1.
Proses tersebut akan berhenti jika tidak memungkinkan lagi untuk melakukan proses pembentukan kandidat pola sekuensial berukuran k+1. Percobaan dilakukan terhadap dua kelompok data, yaitu pengguna internal dan eksternal IPB yang telah mengakses situs web IPB (www.ipb.ac.id) dan telah melewati tahapan praproses (data internal sebanyak 25.162 record
dan data eksternal sebanyak 112.140 record). Dalam pengambilan data eksternal diterapkan metode Simple Random Sampling. Hal ini dikarenakan jumlah data pengguna eksternal yang tersedia dalam jumlah yang besar dan terdapat keterbatasan dalam perangkat lunak yang digunakan.
Pada data pengaksesan pengguna eksternal di antara 5 Januari hingga 18 Juni 2007 dengan selang waktu satu minggu dilakukan pengambilan data hanya pada hari dengan jumlah pengguna terbanyak (ditunjukkan dari banyaknya jumlah alamat IP pengguna yang berbeda pada data per hari). Alamat IP yang berbeda diasumsikan sebagai pengguna yang berbeda. Kemudian dilakukan proses analisis terhadap data yang mencatat request terhadap situs web IPB hingga hierarki level tiga. Pembentukan fuzzy support bagi masing-masing halaman situs web
Sebagai langkah awal pengguna harus terlebih dahulu menentukan nilai ambang batas (threshold). Nilai ambang batas (threshold) digunakan untuk menyaring data pada basis data fuzzy, sedangkan nilai minimum support digunakan untuk menyaring nilai fuzzy support bagi masing-masing pola sekuensial setelah dilakukan proses komputasi menggunakan algoritma Totally Fuzzy. Nilai derajat keanggotaan yang bernilai lebih kecil dari nilai ambang batas tidak akan diperhitungkan. Metode ini dikenal juga sebagai Thresholded Sigma Count.
Selanjutnya dilakukan proses komputasi bagi masing-masing halaman situs web dengan menggunakan algoritma Totally Fuzzy sehingga didapatkan nilai persentase pengaksesan bagi masing-masing halaman situs web dengan kategori pengaksesan rendah, sedang dan tinggi.
• Data Pengguna Internal IPB
Data hasil percobaan didapatkan dengan penerapan algoritma Totally Fuzzy pada data pengguna internal IPB yang mengakses situs web IPB (www.ipb.ac.id) dengan time constraint sekitar 6 bulan. Pada data log akses situs tersebut tercatat 41 halaman web yang diakses oleh pengguna. Percobaan dilakukan terhadap beberapa nilai ambang batas di antara 0,1 hingga 0,6 dengan penambahan nilai ambang batas sebesar 0,05. Nilai fuzzy support
0 0.2 0.4 0.6 0.8 1 1.2 1 0 0.2 0.4 0.6 0.8 1 1.2 1 0,5 1 1 1,5 2 2,5 3 3,5 4 7 (a)
rendah sedang tinggi
1
0,5
5 10 15 20 25
7 (b)
13 terhadap masing-masing halaman web
berdasarkan nilai ambang batas secara lengkap dapat dilihat pada Lampiran 6.
Dari data hasil percobaan menunjukkan bahwa hanya delapan halaman yang memiliki nilai fuzzy support di atas 10% dengan nilai ambang batas sebesar 0,3 yaitu halaman 10 (home), halaman 11 (ipb-bhmn), halaman 18 bhmn/akademik), halaman 21 (ipb-bhmn/others), halaman 22 (ipb-bhmn/ipbphoto), halaman 28 (id/), halaman 34 (id/uploadpictures) serta halaman 54 (ipb-bhmn/gallery) .
Halaman-halaman tersebut merupakan halaman yang sering diakses oleh pengguna situs web IPB yang berasal dari ruang lingkup internal IPB karena memiliki nilai fuzzy support yang cukup besar dibandingkan halaman lainnya.
• Data Pengguna Eksternal IPB
Percobaan dilakukan terhadap data pengguna eksternal IPB yang mengakses situs web IPB (www.ipb.ac.id) dengan time constraint sekitar 6 bulan. Dari data yang tercatat pada data log akses situs web tersebut tercatat 48 halaman yang diakses oleh pengguna.
Data hasil percobaan didapatkan dengan penerapan algoritma Totally Fuzzy dengan beberapa nilai ambang batas di antara 0,1 hingga 0,6 dengan penambahan nilai ambang batas sebesar 0,05. Nilai fuzzy support terhadap masing-masing halaman web berdasarkan nilai ambang batas secara lengkap dapat dillihat pada Lampiran 7.
Dari data hasil percobaan menunjukkan bahwa hanya tujuh halaman yang memiliki nilai fuzzy support di atas 10%, yaitu halaman 10 (home), halaman 11 (ipb-bhmn), halaman 12 bhmn/direktori), halaman 18 (ipb-bhmn/akademik), halaman 21 (ipb-bhmn/others), halaman 22 (ipb-bhmn/ipbphoto), dan halaman 28 (id/).
Pembentukan frequent sequence
Pada tahap ini, metode sequential pattern mining diterapkan untuk membentuk semua kemungkinan frequent sequences dengan menggunakan algoritma Totally Fuzzy. Sebuah sequence berukuran k merupakan kombinasi dari sequence berukuran k-1.
• Data Pengguna Internal IPB
Dilakukan percobaan terhadap data pengguna internal IPB yang tercatat pada data log akses server web situs web IPB dengan time constraint sekitar 6 bulan. Pengujian dilakukan dengan minimum support dari 3% hingga 56% serta variasi nilai ambang batas dari 0,1 hingga 0,6 dengan penambahan sebesar 0,05. Grafik yang menunjukkan jumlah frequent sequence yang terbentuk dengan threshold sebesar 0,2 , 0,4 dan 0,6 serta beberapa variasi nilai minimum support dapat dilihat pada Gambar 8 (a), 8 (b) dan 8 (c).
Dari grafik pada Gambar 8 (a), 8 (b) dan 8 (c), jumlah maksimal frequent sequences yang terbentuk adalah 5.470, 5.237 dan 4.085 buah pada posisi minimum support 3%. Nilai minimum support tertinggi hingga masih terdapat frequent sequence yang terbentuk adalah 56% dengan nilai ambang batas sebesar 0,2 dan 0,4 yaitu 1-sequence sebanyak satu buah. 0 1000 2000 3000 4000 5000 6000 0 20 40 60 jumlah frequent sequence (buah) Minimum Support (%) Pembentukan frequent sequence
dengan threshold 0,2 0 1000 2000 3000 4000 5000 6000 0 20 40 60 jumla h frequent sequence (buah) Minimum Support (%) Pembentukan frequent sequence
dengan threshold 0,4 1 1 64 64 113 64 532 532 3350 5470 2647 5237 8 (b) 8 (a)
14
Pada beberapa minimum support yang digunakan pada saat percobaan, ternyata frequent sequence tidak terbentuk. Hal ini disebabkan karena tidak adanya 2-sequences yang terbentuk. Tidak terbentuknya 2-sequences disebabkan oleh semua 2-sequences hasil penggabungan dari kombinasi 1-sequence mempunyai nilai fuzzy support lebih rendah dari nilai minimum support.
Nilai fuzzy support 1-sequence tertinggi pada setiap nilai threshold umumnya berkisar di antara 55-56% yang didapatkan dari proses komputasi sequence (10 2) atau halaman home dengan kategori pengaksesan rendah. Hal ini dikarenakan halaman home pada situs web IPB sudah mencakup semua link menuju informasi
yang diinginkan oleh pengguna dan untuk mengakses menu lain umumnya pengguna harus melewati halaman home ini terlebih dahulu. Nilai fuzzy support berdasarkan nilai ambang batas dan minimum support secara lengkap dapat dilihat pada Lampiran 8.
Berdasarkan data hasil percobaan pada Tabel 5 dapat dilihat bahwa semakin besar nilai minimum support yang diberikan maka akan semakin sedikit jumlah maksimal frequent sequences yang terbentuk. Banyaknya maksimal item yang dapat dibentuk pada sebuah sequence adalah lima buah (5-sequences), yaitu terbentuk ketika diberikan nilai minimum support sebesar 15%. Hal tersebut menunjukkan bahwa terdapat paling banyak lima halaman yang diakses oleh pengguna internal IPB secara sekuensial. Contoh 5-sequences yang terbentuk adalah [(10 2) (11 2) (18 2) (34 2) (28 2)] dengan nilai fuzzy support sebesar 56,30%.
• Data Pengguna Eksternal IPB
Data hasil percobaan didapatkan dari penerapan algoritma Totally Fuzzy pada data pengguna eksternal IPB yang mengakses situs web IPB (www.ipb.ac.id) dengan time constraint sekitar 6 bulan dapat dilihat pada lampiran 9. Percobaan dilakukan dengan minimum support dari 14% hingga 65% serta variasi nilai ambang batas dari 0,1 hingga 0,6 dengan penambahan sebesar 0,05. Gambar 9 (a), 9 (b) dan 9 (c) menggambarkan jumlah frequent sequence yang terbentuk berdasarkan nilai ambang batas dan minimum support.
0 1000 2000 3000 4000 5000 0 20 40 60 jumla h frequent sequence (buah) Minimum Support (%) Pembentukan frequent sequence
dengan threshold 0,6 Minimum Support Threshold 0,1 0,15 0,2 0,25 0,3 0,35 0,4 0,45 0,5 0,55 0,6 56 1 1 1 1 1 1 1 1 - - - 34 15 15 15 15 15 15 15 15 15 15 15 21 64 64 64 64 64 64 64 64 64 64 15 19 113 113 113 113 113 113 64 64 64 64 64 15 200 200 200 200 200 200 200 200 200 200 200 10 532 532 532 532 532 532 532 532 531 531 531 9 845 846 777 780 717 784 720 720 653 716 653 8 1.149 1.146 1.076 1.072 998 1.149 1.074 1.153 1.150 1.003 1.036 7 1.553 1.384 1.545 1.458 1.546 1.468 1.467 1.554 1.385 1.303 1.076 6 1.814 1.631 1.816 1.723 1.817 1.652 1.652 1.743 1.564 1.479 1.396 5 2.152 1.957 2.153 2.055 2.150 2.052 1.958 2.058 1.867 1.959 1.864 4 3.590 3.214 3.350 3.043 3.362 2.866 2.647 2.721 2.505 2.613 2.330 3 5.465 5.025 5.470 4.997 5.474 4.944 5.237 4.996 4.894 5.183 4.085
Tabel 5 Jumlah frequent sequence berdasarkan nilai ambang batas dan minimum support (internal) Gambar 8 (a), 8 (b) dan 8 (c) adalah jumlah
frequent sequence terhadap nilai threshold dan minimum support terhadap data pengguna internal
0 15 64 531 2330 4085 8 (c)
15 Minimum Support Threshold 0,1 0,15 0,2 0,25 0,3 0,35 0,4 0,45 0,5 0,55 0,6 65 1 1 1 1 1 1 - - - 50 4 4 4 4 4 4 4 4 4 4 4 34 4 4 4 4 4 4 4 4 4 4 4 23 15 15 15 15 15 15 15 15 4 4 4 19 64 64 64 64 64 64 64 64 15 15 15 18 64 64 64 64 64 64 64 64 64 64 64 17 64 64 64 64 64 64 64 64 64 64 64 16 325 325 325 325 325 325 64 64 64 64 64 15 325 325 325 325 325 325 325 325 325 325 64 14 325 325 325 325 325 325 325 325 325 325 325 9 (a) 9 (b)
Berdasarkan grafik pada Gambar 8 (a), 8 (b) dan 8 (c), dapat dilihat bahwa jumlah maksimal frequent sequence yang terbentuk adalah 325 buah pada posisi minimum support 14%, 15% dan 16%. Nilai minimum support tertinggi hingga masih terdapat frequent sequences yang terbentuk adalah 65% dengan nilai ambang batas sebesar 0,2 yaitu 1-sequence sebanyak satu buah. Hal ini menunjukkan bahwa untuk penggunaan minimum support di atas 65% tidak menghasilkan frequent sequence .
Nilai fuzzy support 1-sequence tertinggi pada setiap nilai threshold umumnya berkisar diantara 65-64% yang didapatkan dari proses komputasi sequence (10 2) atau halaman home dengan kategori pengaksesan rendah. Nilai fuzzy
0 50 100 150 200 250 300 350 0 20 40 60 80 Jumlah frequent sequence (buah) Minimum Support (%) Pembentukan frequent sequence
dengan threshold 0,2 0 50 100 150 200 250 300 350 0 20 40 60 80 Jumlah frequent sequence (buah) Minimum Support (%) Pembentukan frequent sequence
dengan threshold 0,4 0 50 100 150 200 250 300 350 0 20 40 60 80 Jumlah frequent sequence (buah) Minimum Support (%) Pembentukan frequent sequence
dengan threshold 0,6
Tabel 6 Jumlah frequent sequence berdasarkan nilai ambang batas dan minimum support (eksternal) Gambar 9 (a), 9 (b) dan 9 (c) adalah jumlah
frequent sequence terhadap nilai threshold dan minimum support terhadap data pengguna eksternal. 325 64 15 4 4 1 325 64 15 4 4 0 325 64 4 4 4 15 0 9 (c)
16 support berdasarkan nilai ambang batas dan
minimum support secara lengkap dapat dilihat pada Lampiran 9.
Dengan menerapkan algoritma Totally Fuzzy ternyata jumlah maksimal item yang dapat dibentuk pada sebuah pola sekuensial adalah lima buah (5-sequences). Hal ini menunjukkan bahwa jumlah halaman yang diakses oleh pengguna eksternal secara sekuensial adalah paling banyak lima halaman. Contoh 5-sequences yang terbentuk adalah [(10 2) (28 2) (12 2) (11 2) (18 2)] dengan nilai fuzzy support sebesar 64,84%.
Berdasarkan data pada Tabel 6 diperoleh informasi bahwa peningkatan nilai threshold ternyata tidak terlalu mempengaruhi jumlah frequent sequence yang terbentuk kecuali untuk pembentukan 1-sequence. Variasi jumlah frequent sequence yang terbentuk lebih dipengaruhi oleh variasi nilai minimum support .
Waktu eksekusi yang diperlukan untuk membentuk frequent sequence sangat dipengaruhi oleh nilai ambang batas dan
minimum support yang digunakan.
Perbandingan waktu eksekusi yang diperlukan untuk membentuk frequent sequence dari seluruh percobaan yang telah dilakukan dapat dilihat pada Gambar 10 dan 11.
Gambar 11 Grafik perbandingan waktu eksekusi terhadap data pengguna eksternal.
Menurut Gambar 10 dan 11, semakin tinggi nilai minimum support yang digunakan maka semakin cepat waktu yang diperlukan untuk membentuk frequent sequence. Hal ini disebabkan semakin besar nilai minimum support maka akan semakin sedikit sequence yang membentuk frequent sequence sehingga waktu komputasi untuk pembentukan frequent sequence akan semakin cepat. Jumlah pola sekuensialyang semakin sedikit disebabkan oleh banyaknya pola sekuensialyang memiliki nilai fuzzy support di bawah nilai minimum support yang digunakan. Selain itu, juga diperoleh informasi bahwa semakin besar nilai ambang batas yang diberikan maka akan semakin cepat waktu yang digunakan untuk membentuk frequent sequence.
Hal tersebut disebabkan karena makin sedikitnya jumlah data yang memiliki nilai di atas nilai ambang batas yang ditentukan.
Evaluasi Pola
Seluruh frequent sequence yang dihasilkan pada tahap web mining kemudian dievaluasi untuk mendapatkan pola sekuensial. Evaluasi dilakukan dengan mencari frequent sequence yang maksimal dari seluruh frequent sequences yang ada. Suatu pola sekuensial dikatakan maksimal jika pola sekuensial tersebut tidak termuat pada pola sekuensial lainnya.
Dari seluruh pola sekuensial yang terbentuk diambil pola sekuensial yang memiliki nilai
0 50 100 150 200 250 300 350 400 0 20 40 60 Waktu Eksekusi (d et ik) Minimum Support (%) Perbandingan Waktu Eksekusi
0 200 400 600 800 1000 0 20 40 60 80 Waktu Eksekusi (d et ik) Minimum Support (%) Perbandingan Waktu Eksekusi
Gambar 10 Grafik perbandingan waktu eksekusi terhadap data pengguna internal.
Threshold 0.2 Threshold 0.4 Threshold 0.6 Threshold 0.2 Threshold 0.4 Threshold 0.6
17 fuzzy support tertinggi dengan jumlah
k-sequence maksimal pada nilai minimum support tertinggi yang dilakukan selama tahap percobaan.
Suatu pola sekuensial dikatakan menarik jika terjadi pada minimum support yang tinggi. Daftar pola sekuensial yang menarik dari seluruh percobaan yang telah dilakukan pada data pengaksesan pengguna terhadap situs web IPB dapat dilihat pada Tabel 7 dan 8.
Dari evaluasi pola yang terdapat pada Tabel 7 dan 8, diperoleh informasi sebagai berikut :
Nilai minimum support yang menghasilkan sequence dengan item paling banyak adalah 15% bagi data pengguna internal dan 16% bagi data pengguna eksternal.
Nilai minimum support yang menghasilkan sequence dengan item paling sedikit adalah 65% bagi data pengguna internal dan 56% bagi data pengguna eksternal.
Umumnya pengguna internal situs web IPB mengakses halaman 10 (home), 11 (/ipb-bhmn/), 18 (ipb-bhmn/akademik), 28 (/id)
dan 34 (id/uploadedpictures) secara sekuensial.
Umumnya pengguna eksternal situs web IPB mengakses halaman 10 (home), 11 (/ipb-bhmn/), 12 (/ipb-bhmn/direktori), 18 (ipb-bhmn/akademik) dan 28 (/id) secara sekuensial.
Representasi Pengetahuan
Representasi pengetahuan dari pola sekuensial yang dihasilkan diperlukan agar pola yang ada mudah dimengerti dan diinterpretasikan. Berdasarkan hasil presentasi diharapkan dapat diperoleh pengetahuan yang berharga dari koleksi data yang telah dilakukan proses mining.
• Data Pengguna Internal
Data hasil percobaan pada Tabel 9 menunjukkan bahwa pembentukan nilai fuzzy support bagi masing-masing halaman terdapat hanya delapan halaman yang memiliki nilai fuzzy support di atas 10% dengan jumlah item
Nilai threshold Minimum Support Tertinggi (%) Maksimal Item pada sequence Jumlah Frequent Sequence Nilai fuzzy support tertinggi (%) Contoh Pola Sekuensial yang terbentuk 0,1 21 4 24 56,66 [(10 2) (11 2) (34 2) (28 2)] 0,15 21 4 24 56,66 [(10 2) (34 2) (11 2) (28 2)] 0,2 21 4 24 56,30 [(10 2) (34 2) (28 2) (11 2)] 0,25 21 4 24 56,30 [(10 2) (11 2) (18 2) (28 2)] 0,3 21 4 24 56,30 [(10 2) (11 2) (34 2) (28 2)] 0,35 21 4 24 56,30 [(10 2) (34 2) (11 2) (28 2)] 0,4 15 5 480 56,30 [(10 2) (11 2) (18 2) (34 2) (28 2)] 0,45 15 5 480 56,30 [(10 2) (18 2) (11 2) (34 2) (28 2)] 0,5 15 5 480 55,43 [(10 2) (11 2) (18 2) (34 2) (28 2)] 0,55 15 5 480 55,43 [(10 2) (34 2) (28 2) (18 2) (11 2)] 0,6 15 5 480 55,43 [(10 2) (34 2) (28 2) (18 2) (11 2)]
Tabel 7 Daftar pola sekuensial yang menarik (data pengguna internal)
Tabel 8 Daftar pola sekuensial yang menarik (data pengguna eksternal)
Nilai threshold Minimum Support Tertinggi (%) Maksimal Item pada sequence Jumlah Frequent Sequence Nilai fuzzy support tertinggi (%) Contoh Pola Sekuensial yang terbentuk 0,1 16% 5 120 64,84 [(10 2) (28 2) (11 2) (12 2) (18 2)] 0,15 16% 5 120 64,84 [(10 2) (28 2) (11 2) (12 2) (18 2)] 0,2 16% 5 120 64,84 [(10 2) (28 2) (12 2) (11 2) (18 2)] 0,25 16% 5 120 64,84 [(10 2) (12 2) (28 2) (11 2) (18 2)] 0,3 16% 5 120 64,84 [(10 2) (28 2) (11 2) (12 2) (18 2)] 0,35 16% 5 120 64,84 [(10 2) (28 2) (11 2) (18 2) (12 2)] 0,4 15% 5 120 64,78 [(10 2) (28 2) (11 2) (18 2) (12 2)] 0,45 15% 5 120 64,78 [(10 2) (28 2) (11 2) (12 2) (18 2)] 0,5 15% 5 120 64,74 [(10 2) (28 2) (12 2) (11 2) (18 2)] 0,55 15% 5 120 64,58 [(10 2) (28 2) (12 2) (11 2) (18 2)] 0,6 14% 5 120 64,55 [(10 2) (28 2) (12 2) (11 2) (18 2)]
18 yang membentuk suatu pola sekuensial
terbanyak yaitu 5 item (5-sequences).
Tabel 9 Daftar fuzzy support yang memiliki nilai di atas 10% dengan threshold 0,3 (data internal)
Halaman Kategori support Fuzzy (%) home rendah 56,31 home sedang 19,02 ipb-bhmn rendah 34,92 ipb-bhmn/akademik rendah 18,04 ipb-bhmn/others rendah 12,03 ipb-bhmn/ipbphoto rendah 12,16 id/ rendah 34,55 id/uplodedpictures rendah 21,92 ipb-bhmn/gallery rendah 10,63
Contoh pola sekuensial dengan fuzzy support tertinggi dengan nilai minimum support 21 % yaitu (home, rendah) (ipb-bhmn, rendah) (id/uploadedpictures, rendah) (id, rendah) dengan nilai fuzzy support sebesar 56,66%. Pola tersebut memiliki arti bahwa sebanyak 56,66% dari total jumlah data pengguna internal situs web IPB melakukan pengaksesan dengan pola tersebut secara sekuensial dengan diawali mengakses halaman 10 (home), diikuti halaman 11 (ipb-bhmn), 34 (/id/uploadedpictures) dan 28 (/id).
Contoh pola sekuensial yang memiliki jumlah item terbanyak (5-sequences) terjadi pada minimum support 15% adalah (home, rendah) bhmn, rendah) (ipb-bhmn/akademik) (id/uploadedpictures, rendah) (id, rendah) dengan nilai fuzzy support sebesar 56,30%. Pola sekuensial tersebut mempunyai arti bahwa sebanyak 56,30% dari total data pengguna internal IPB melakukan pengaksesan dengan pola tersebut secara sekuensial diawali dengan mengakses halaman 10 (home) diikuti halaman 11 (ipb-bhmn), 18 (ipb-bhmn/akademik), 34 (id/ uploadedpictures) dan 28 (id).
• Data Pengguna Eksternal
Data hasil percobaan pada Tabel 10 menunjukkan bahwa pada data pengguna eksternal terdapat tujuh halaman yang memiliki nilai fuzzy support di atas 10%.
Tabel 10 Daftar fuzzy support yang memiliki nilai di atas 10% dengan threshold 0,3 (data eksternal)
Halaman Kategori Fuzzy support (%) Home rendah 65,03 ipb-bhmn rendah 50,67 ipb-bhmn/direktori rendah 19,24 ipb-bhmn/akademik rendah 16,17 ipb-bhmn/others rendah 12,20 ipb-bhmn/ipbphoto rendah 13,37 id rendah 23,22
Representasi pengetahuan terhadap pola sekuensial hanya dilakukan pada pola sekuensial dengan minimum support 16% yang memiliki jumlah maksimal item terbanyak yaitu lima (5-sequences) dan pola sekuensi yang memiliki nilai fuzzy support tertinggi.
Contoh pola sekuensial dengan nilai fuzzy support tertinggi dengan nilai minimum support 16% yaitu (home, rendah) (id, rendah)
(ipb-bhmn, rendah) (ipb-bhmn/direktori, rendah) (ipb-bhmn/akademik, rendah) dengan nilai fuzzy support sebesar 64,84%. Pola tersebut memiliki arti bahwa sebanyak 64,84% dari total jumlah pengguna eksternal situs web IPB melakukan pengaksesan dengan pola tersebut secara sekuensial diawali mengakses halaman 10 (home) diikuti halaman 28 (/id/), 11 (/ipb-bhmn/), 12 (/ipb-bhmn/direktori ) dan 18 (/ipb-bhmn/akademik)
Berdasarkan hasil penelitian, terdapat beberapa saran bagi web master situs web IPB, yaitu :
1. Menempatkan link yang merupakan penghubung menuju halaman /ipb-bhmn, /ipb-bhmn/akademik, /ipb-bhmn/others, /ipb-bhmn/ipbphoto, /id, /id/uploaded pictures, dan /ipb-bhmn/gallery pada halaman utama.
2. Menempatkan link yang merupakan penghubung menuju halaman /ipb-bhmn, /ip-bhmn/direktori, /ipb-bhmn/akademik, ip-bhmn/others, /ipb-bhmn/ipbphoto dan /id/ pada halaman utama.
3. Menempatkan konten situs web IPB secara efisien pada halaman-halaman tertentu sesuai dengan sasaran pengguna. Misalnya, menempatkan link menuju halaman
19 mengenai pengumuman hasil USMI, pada
halaman-halaman yang sering diakses oleh pengguna eksternal. Dengan melakukan hal tersebut diharapkan dapat mengurangi distribusi beban situs web IPB.
4. Pola sekuensial dengan nilai fuzzy support tertinggi bagi data pengguna internal adalah (home, rendah) (ipb-bhmn, rendah) (ipb-bhmn/akademik, rendah)
(id/uploadedpictures, rendah) (id, rendah), yaitu sebesar 56,66%. Web master sebaiknya mengalokasikan link di antara halaman-halaman pada pola sekuensial tersebut sehingga memudahkan pengguna dalam mengakses nya.
5. Pola sekuensial dengan nilai fuzzy support tertinggi bagi data pengguna eksternal adalah (home, rendah) (id, rendah) (ipb-bhmn, rendah) (ipb- bhmn/direktori) (ipb- bhmn/akademik, rendah), yaitu sebesar 56,30%. Web master sebaiknya mengalokasikan link di antara halaman-halaman pada pola sekuensial tersebut sehingga memudahkan pengguna dalam mengakses nya.
Untuk melakukan proses pembentukan frequent sequence telah dibangun sebuah aplikasi sederhana dengan menggunakan matlab 7.0.1. Salah satu antarmuka grafis dari aplikasi tersebut dapat dilihat pada Gambar 12.
Gambar 12 Antarmuka grafis aplikasi.
KESIMPULAN DAN SARAN
Kesimpulan
Dari hasil percobaan dengan penerapan algoritma Totally Fuzzy yang dilakukan terhadap data pengaksesan pengguna terhadap situs web IPB, diperoleh kesimpulan bahwa nilai minimum support tertinggi hingga masih terbentuk frequent sequence terjadi pada nilai minimum support 56% bagi data pengguna internal dan 65% bagi data pengguna eksternal. Nilai support menunjukkan persentase dukungan data terhadap validasi sebuah pola sekuensial. Kelompok pengguna dibedakan berdasarkan alamat IP dari proxy server yang tercatat pada data log akses. Pola sekuensial dengan jumlah item terbanyak yaitu 5-sequences dengan minimum support 15% bagi data pengguna internal dan 16 % bagi data pengguna eksternal.
Pengguna internal situs web IPB memiliki frekuensi yang lebih tinggi dalam mengakses halaman bhmn, bhmn/akademik, /ipb-bhmn/others, /ipb-bhmn/ipbphoto, /id, /id/uploadedpictures dan /ipb-bhmn/gallery, sedangkan pengguna eksternal situs web IPB memiliki frekuensi yang lebih tinggi dalam mengakses halaman bhmn, bhmn/direktori, bhmn/akademik, /ipb-bhmn/others, /ipb-bhmn/ipbphoto dan /id/.
Pola sekuensial dengan nilai fuzzy support tertinggi bagi data pengguna internal adalah halaman halaman (home, rendah) (ipb-bhmn, rendah) (ipb-bhmn/akademik, rendah)
(id/uploadedpictures, rendah) (id, rendah), yaitu sebesar 56,66%, sedangkan pola sekuensial dengan nilai fuzzy support tertinggi bagi data pengguna eksternal adalah halaman (home, rendah) (id, rendah) (ipb-bhmn, rendah) (ipb-bhmn/direktori, rendah)
(ipb-bhmn/akademik, rendah), yaitu sebesar 56,30%. Hal tersebut menggambarkan pola sekuensial yang sering dilakukan oleh pengguna situs web IPB. Web master sebaiknya mengalokasikan link di antara halaman-halaman pada pola sekuensial tersebut sehingga memudahkan pengguna dalam mengakses nya.
Selain itu, mengalokasikan link yang merupakan penghubung menuju halaman yang banyak diakses oleh pengguna internal dan eksternal pada halaman utama atau lokasi yang mudah terlihat dan terjangkau oleh pengguna