PENGEMBANGAN
WEB AGGREGATOR
INSTITUT PERTANIAN BOGOR
MENGGUNAKAN
SINGLE STREAM AGGREGATION
HANNISSA FITRI ASRY
DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2011
ABSTRACT
HANNISSA FITRI ASRY. Web Aggregator Development of Bogor Agricultural University using Single Stream Aggregation Method. Supervised by: SONY HARTONO WIJAYA.
Information is easily accessible without any geographical and time constraints because of Internet growth. Everyone needs information to keep updated. With the RSS (Really Simple Syndication) technology, a method to encapsulate and distribute news in a solid and informative package, any Internet users can follow updated news without having to always search news of interests. The information system uses a so called Aggregator Technology.
In this study, web aggregator development of Bogor Agricultural University is developed using Single Stream Aggregation method. This method puts the latest updated news on top position on each news source. This study also classifies news by topic to facilitate users in getting specific news. The classification is conducted using k-Nearest Neighbor
The results show that the Aggregator system can be made to collect all news from available feeds based on sequence time. The system is successful on classifying documents with the percentage accuracy 53% with k=5.
Keywords : RSS, Aggregator, Single Stream Aggregation, clasification, KNN
PENGEMBANGAN
WEB AGGREGATOR
INSTITUT PERTANIAN BOGOR
MENGGUNAKAN
SINGLE STREAM AGGREGATION
HANNISSA FITRI ASRY
G64076029
Skripsi
Sebagai salah satu syarat untuk memperoleh gelar Sarjana Komputer pada
Program Studi Ilmu Komputer
DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2011
Judul skripsi : Pengembangan Web Aggregator Institut Pertanian Bogor Menggunakan Single Stream Aggregation
Nama : Hannissa Fitri Asry
NIM : G64076029
Program Studi : Ilmu Komputer
Menyetujui,
Dosen Pembimbing,
Sony Hartono Wijaya, S.Kom, M.Kom NIP.19810809 200812 1 002
Mengetahui:
Ketua Departemen,
Dr. Ir. Sri Nurdiati, M.Sc. NIP. 19601126 198601 2 001
Tanggal Lulus :
RIWAYAT HIDUP
Penulis dilahirkan di Medan pada tanggal 5 Mei 1986 dari ayah Nasri Pily dan ibu Hj. Yusni Rudang Br. Tarigan. Penulis merupakan anak kedua dari enam bersaudara.
Tahun 2004 penulis lulus dari Sekolah Menengah Umum Swasta Al-Azhar Medan dan pada tahun yang sama penulis diterima di Institut Pertanian Bogor (IPB) melalui jalur Undangan Seleksi Masuk IPB (USMI) sebagai mahasiswa Diploma 3 pada Program Studi Elektronika dan Teknologi Komputer, Fakultas Matematika dan Ilmu Pengetahuan Alam. Tahun 2007 penulis lulus program Diploma 3 dan pada tahun yang sama melanjutkan studi di Program Sarjana Ilmu Komputer Penyelenggaraan Khusus IPB, Fakultas Matematika dan Ilmu Pengetahuan Alam (FMIPA) Institut Pertanian Bogor.
PRAKATA
Segala puji bagi Allah SWT atas limpahan rahmat serta karuniaNya dan semoga shalawat serta salam tetap tercurahkan kepada nabi besar Muhammad SAW. Puji dan syukur penulis panjatkan karena akhirnya karya ilmiah dengan judul Pengembangan Web Aggregator Institut Pertanian Bogor menggunakan Single Stream Aggregation ini dapat diselesaikan. Karena karya ilmiah ini dibuat sebagai salah satu syarat untuk memperoleh gelar Sarjana Komputer di Fakultas Matematika dan Ilmu Pengetahuan Alam Insitut Pertanian Bogor.
Penulis mengucapkan terima kasih kepada semua pihak yang telah membantu sehingga skripsi ini dapat diselesaikan, diantaranya :
1. Ayah dan Mamak terkasih atas dukungan, doa dan kasih sayangnya kepada penulis.
2. Bapak Sony Hartono Wijaya, S.Kom, M.Kom. selaku pembimbing atas waktu, saran, dan bimbingan yang telah diberikan.
3. Bapak Firman Ardiansyah dan Bapak Ahmad Ridha sebagai dosen penguji yang bersedia meluangkan waktu untuk menguji.
4. Abang serta adik-adikku yang selalu memberikan perhatiannya.
5. Kak Ihsan yang telah banyak membantu memberikan ilmu dan waktunya.
6. Kak Deni yang selalu sabar memberikan dukungan.
7. Kibus, Anis, Anggi, Eka, Bobi, Tia dan teman-teman seperjuangan di Ekstensi ILKOM.
8. Epen yang selalu memberikan hiburan.
9. Bapak Julio Adisantoso, terima kasih atas kesabaran dan kemurahan hati.
10. Semua pihak yang tidak dapat penulis sebutkan satu persatu yang telah membantu penulis dalam menyelesaikan penelitian ini.
Akhirnya penulis berharap semoga skripsi ini dapat bermanfaat bagi semua pihak yang membutuhkan. Amin.
Bogor, Oktober 2011
Hannissa Fitri Asry
DAFTAR ISI
Halaman
DAFTAR GAMBAR ... v
DAFTAR LAMPIRAN ... v
LAMPIRAN ... 13
DAFTAR GAMBAR
Halaman
Halaman
1 Tabel Test Case 1 9
2 Tabel Test Case 2 10
3 Tabel Confusion Matrix 11
DAFTAR LAMPIRAN
Halaman
1 Software Feed Validator 14
2 Feed Tidak Valid. 15
3 Struktur File RSS Feed 16
4 Halaman Utama Sistem 18
5 Form Login Administrator 19
6 Form Kategori 20
7 Form Tambah Kategori 21
8 Form Daftar Feed 22
9 Form Edit Akun 23
10 Form Edit Kata Unik 24
11 Perancangan DatabaseRSS 25
Tabel Categories 25
Tabel Feeds 25
Tabel user 25
12 Struktur Database 26
13 Stopwords 27
14 Daftar Berita 28
PENDAHULUAN merangkum dan mendistribusikan berita dalam suatu kemasan yang padat dan tetap informatif, seorang pengguna internet dapat tetap mengikuti perkembangan suatu berita tanpa harus mengunjungi setiap halaman web untuk memperoleh informasi tersebut. Informasi RSS ditempatkan ke dalam satu file dalam sebuah situs web dengan cara yang mirip dengan halaman web biasa. Informasi yang dikodekan dalam bahasa komputer XML untuk digunakan oleh sebuah program yang disebut dengan RSS
aggregator.
Aggregator adalah suatu sistem yang menyerap dan mengumpulkan isi beberapa
website. Isi dari website aggregator bisa berasal dari web blog, podcast, vlog, dan situs web
media utama. RSS Aggregator secara otomatis memeriksa serangkaian item terbaru dari RSS
feed secara berkala. Sistem aggregator ini dapat diterapkan pada situs-situs organisasi, bisnis, dan institusi atau kelembagaan.
Institut Pertanian Bogor (IPB) merupakan sebuah institusi pendidikan yang masing-masing fakultas dan departemen memiliki situs resmi yang di-update secara berkala. IPB belum mempunyai sistem pengumpul berita (aggregator). Sistem aggregator untuk situs IPB dibuat sebagai sarana untuk memudahkan pengunjung situs tersebut untuk mendapatkan
update berita dari tiap fakultas dan departemen yang ada sehingga dapat disajikan dalam bentuk yang layak untuk dibaca hanya pada satu halaman web saja, dan diharapkan dengan adanya aggregator tidak ada lagi informasi yang luput dari pantauan para akademisi secara umum dan civitas IPB secara khusus.
Tujuan
Penelitian ini bertujuan mengembangkan RSS aggregator pada web IPB dengan menggunakan metode Single Stream Aggregation sebagai sarana untuk memudahkan pengguna mendapatkan update berita di lingkungan Institut Pertanian Bogor.
Ruang Lingkup
Aggregator yang dikembangkan pada penelitian ini hanya mengambil feed-feed dari situs Fakultas dan Departemen di IPB yang menyediakan fitur RSS feed saja, yaitu: Fakultas Peternakan (FAPET), Departemen Ilmu Keluarga dan Konsumen (IKK) FEMA, yang dikembangkan adalah mempermudah seorang pengguna atau pengunjung web untuk memperoleh berita dari tiap fakultas atau departemen yang telah terklasifikasi tanpa harus mengunjungi situs dari masing-masing fakultas atau departemen tersebut.
TINJAUAN PUSTAKA
Website
Website ialah sistem penyebaran informasi melalui internet. Banyak hal yang terdapat pada suatu web, dan yang menarik adalah banyak halaman web yang menggabungkan data teks, data gambar diam atau bergerak, data animasi, suara, video dan atau gabungan dari semuanya. Halaman-halaman web yang terkait yang membentuk suatu rangkaian yang mana masing-masing dihubungkan dengan jaringan-jaringan halaman yang disebut hyperlink (Wittenbrink 2005 ).
Halaman web dibangun dengan menggunakan markup language yang disebut HTML (HyperText Markup Language) merupakan bahasa yang mengandung perintah kepada browser (Internet Explorer , Mozilla Firefox, Opera, Safari dan lainnya) untuk menampilkan teks, gambar dan file multimedia lainnya (Gralla 2007).
Contoh dari salah satu website disajikan pada Gambar 1.
Jenis web berdasarkan sifatnya adalah :
- Website dinamis, web yang isi atau informasinya selalu berubah-ubah setiap saat.
- Website statis, web yang isi atau informasinya sangat jarang diubah.
Web Server
Web server adalah sebuah bentuk server
yang khusus digunakan untuk menyimpan situs
web. Komputer dapat dikatakan sebagai web server jika komputer tersebut memiliki suatu program server yang disebut Personal Web Server (PWS). PWS ini difungsikan agar halaman web yang ada dalam sebuah komputer
server dapat dipanggil oleh komputer client.
Macam-macam web server antara lain Apache, IIS, Xitami, dan PWS. Apache yang dikembangkan oleh komunitas open source
merupakan web server yang paling populer dan paling banyak digunakan (Nugroho 2005).
MySQL
MySQL merupakan salah satu database
yang berkembang di lingkungan open source
dan didistribusikan secara gratis di bawah lisensi GPL (General public License). MySQL adalah sistem manajemen database yang free
tetapi memiliki banyak keunggulan dibandingkan dengan sistem manajemen
database lainnya, yaitu performance, support,
dan fitur-fitur yang lengkap. Fitur yang ditawarkan MySQL (Dubois 2003) antara lain :
- Kecepatan.
- Mudah digunakan.
- Capability. Banyak client yang dapat terhubung ke server secara bersamaan.
- Connectivity dan security.
- Portability. MySQL dapat berjalan pada banyak sistem operasi.
- Availability dan harga. MySQL tersedia secara gratis di bawah GPL.
Really Simple Syndication (RSS)
RSS adalah singkatan dari Really Simple Syndication, yakni suatu metode terbuka untuk pengumpulan (syndicating) dan penyatuan (aggregating) isi dari sebuah web. Sebuah file RSS memberikan data informasi ringkas (summary) tentang headlines, links, dan article
dari website.
RSS adalah istilah kolektif untuk format
news feed. Teknologi RSS berhubungan erat dengan update informasi. Istilahnya dikembangkan dari singkatan yang dapat diintepretasikan dalam beberapa cara yang berbeda yaitu :
- RDF Site Summary
- Rich Site Summary
- Really Simple Syndication (Wittenbrink 2005).
RSS menggunakan bahasa XML sebagai formatnya. Sebuah file RSS menerangkan isi dari sebuah saluran informasi (channel) yang berisi logo/image, site link,input box dan items. Items pada file RSS sering disebut sebagai
“news item”. Website tertentu dapat menyalin dan menggunakan RSS yang dimiliki website
lain untuk menginformasikan berita atau artikel. Hal ini disebut dengan RSS feed. Gambar 2 mengilustrasikan alur pembuatan feed (RSS) di
web server dan pengambilan feed oleh user.
Gambar 2 RSS Feed
Sebuah program komputer yang dikenal sebagai pembaca umpan (feed reader) bertindak sebagai pengumpul. Tenggang waktu dan siklus pengumpulan RSS biasanya dapat diatur oleh penggunanya. Program pengumpul dapat berupa program komputer atau sebuah layanan web
yang tersedia secara on line.
Aggregator Pada prosesnya, aggregator memisahkan perbedaan-perbedaan informasi yang semantik atau kontekstual (Stuart 2001).
Menurut definisi yang disarankan, ada tiga karakteristik spesifik yang penting untuk sebuah
web aggregator.
- Access Transparency, pada sumber-sumber datanya, sebuah aggregator terlihat seperti seorang pengguna yang normal yang mengakses informasi.
- Contextual Transparency, aggregator
memisahkan perbedaan-perbedaan yang kontekstual untuk mendapatkan perbandingan-perbandingan yang efektif.
- Analysis, sebagai pengganti dari penyajian yang sederhana, aggregator menyatukan penambahan nilai informasi yang berdasar pada analisis post-aggregation.
Salah satu contoh sistem aggregator pada situs Institut Teknologi Bandung dapat dilihat pada Gambar 4.
Gambar 4 Web Aggregator ITB
Single Stream Aggregation
Ada beberapa metode dalam pengumpulan berita. Salah satunya ialah dengan metode
Single Stream Aggregation. Cara kerja metode ini ialah dengan cara mengambil berita dari berbagai sumber mengenai satu topik berita yang sama dan menggabungkannya ke dalam sebuah Single Stream. Single Stream dalam hal ini ialah halaman web tunggal.
Berita-berita yang telah masuk ke dalam
feed akan disajikan dalam satu halaman web. Metode ini menempatkan update berita yang terbaru pada posisi yang teratas dari tiap sumber berita. Single Stream Aggregation adalah salah satu metode yang baik untuk tetap dapat menarik lebih dari satu umpan (feed) (Catone 2007). Gambar 5 merupakan arsitektur diagram
Single Stream.
Gambar 5 Arsitektur Single Stream
Pada Gambar 5 di atas menjelaskan cara kerja metode Single Stream Aggregation yaitu mengambil artikel dari beberapa situs kemudian dari artikel-artikel berita yang ada disaring dan ditampilkan berdasarkan kategori. Sebagai contoh pada gambar web aggregator di atas yaitu web tentang kesehatan, maka berita yang ditampilkan adalah artikel tentang kesehatan. Oleh karena itu web tersebut hanya mengambil berita mengenai artikel kesehatan saja, dan berita-beritanya ditampilkan berdasarkan urutan waktu terbaru.
k-Nearest Neighbor (KNN)
k-Nearest Neighbor merepresentasikan setiap data sebagai titik dalam k-ruang dimensi. Jika ada sebuah data uji, maka akan dihitung kedekatan titik data tersebut dengan titik data lainnya pada data latih untuk diklasifikasikan berdasarkan kedekatannya yang didefinisikan dengan ukuran jarak (Han & Kamber 2006).
di= (xi−yi)
Proses KNN akan mengolah data dari hasil pra proses untuk dicari kategorinya. Proses perhitungan dilakukan dengan cara menghitung jarak terpendek data masukan terhadap data nilai K yang telah ditentukan.
5. Dengan melihat pola kelas yang terbanyak, maka data uji termasuk ke dalam kelas tersebut.
Stemming
Stemming adalah suatu proses mendapatkan kata dasar dari sebuah kata. Kata dasar ini kemudian dapat digunakan sebagai token, yang merupakan salah satu kriteria penciri dokumen dan kueri (Salton1989). Stemming dilakukan atas asumsi bahwa kata-kata yang memiliki
stem yang sama memiliki makna yang serupa, sehingga sistem dapat menemukan lebih banyak dokumen yang relevan dengan kueri pengguna.
Extensible Markup Language (XML)
XML merupakan kumpulan aturan yang mendefinisikan tag semantik yang membagi dokumen menjadi bagian-bagian dan mengidentifikasi bagian-bagian berbeda dari dokumen (Iqbal 2009). XML untuk saat ini mendefinisikan susunan informasi dan berfokus
pada informasi itu sendiri. Kelebihan lain yang dimiliki XML adalah bahwa informasi bisa dipertukarkan dari satu sistem ke sistem yang berbeda platform. Misalnya dari Windows ke Unix.
Seperti halnya HTML, XML juga menggunakan elemen yang ditandai dengan tag
pembuka (diawali dengan ‘<’ dan diakhiri dengan ‘>’), tag penutup (diawali dengan ‘</’ dan diakhiri ‘>’) dan attribut elemen (parameter yang digunakan dalam tag pembuka misal <form name=”isidata”>). Hanya bedanya, HTML mendefinisikan dari awal tag dan attribut yang dipakai di dalamnya, sedangkan pada XML seseorang bisa menggunakan tag
dan atribut sesuai dengan kehendak.
Contoh tag HTML:
<subyek>permohonan tenaga kerja
baru</subyek>
<isi>mohon diberikan tenaga kerja baru di Departemen MIS</isi>
</pesan>
Prototyping
Menurut Sommervile (2001), prototyping
merupakan pengembangan sistem cepat dimana pengembang dan pengguna dapat saling berinteraksi selama proses pembuatan sistem.
Gambar 6 Metode Prototipe
Pengujian Black Box
Metode pengujian Black Box merupakan metode pengujian terhadap spesifikasi program atau komponen. Proses pengujian ini dapat ditentukan dengan mempelajari masukan dan kemungkinan hasilnya. Nama lain dari metode ini ialah pengujian fungsional, karena pada metode ini penguji hanya fokus pada fungsional perangkat lunak (Sommerville 2001). Gambar 7 mengilustrasikan metode Black Box.
Gambar 7 Metode Pengujian Black Box
Pengujian black box berusaha menemukan kesalahan dalam kategori :
- Fungsi yang tidak benar atau hilang
- Kesalahan interface
- Kesalahan dalam struktur data atau akses -database eksternal
- Kesalahan kinerja
- Inisialisasi dan kesalahan terminasi
METODOLOGI PENELITIAN
Pada tahap ini dilakukan studi literatur yaitu untuk mengumpulkan semua bahan pustaka yang relevan dengan topik atau tema penelitian, dan memilih metode pengumpulan berita yang akan dipakai dan menganalisa metode tersebut, termasuk juga menganalisis pengklasifikasian beritanya. kategorinya. Sebelumnya akan dilakukan beberapa tahapan proses lebih lengkapnya dijelaskan pada bab pembahasan. Tahap ini juga melakukan perancangan antarmuka sistem dan perancangan basis data. adalah melakukan transformasi pemodelan sistem pada tahap perancangan menjadi
berlaku pada sistem, dengan cara memberikan sejumlah masukan tertentu kemudian diperiksa apakah keluaran yang dihasilkan sesuai dengan tujuan, jika belum sesuai maka akan dilakukan perbaikan,
feed RSS. Dari hasil yang didapat ada beberapa yang telah menyediakan feed dan tidak semua digunakan untuk umpan sistem aggregator yang dibuat. Sistem menggunakan tiga buah feed dari situs-situs terkait di IPB yaitu:
- http://fema.ipb.ac.id
- http://ikk.fema.ipb.ac.id
- http://psp.ipb.ac.id
- http://ipb.ac.id
Dari masing-masing situs tersebut dapat dilihat berita mengenai topik apa saja yang paling banyak diberitakan, antara lain:
1. Beasiswa, yaitu berita mengenai informasi beasiswa yang diberikan dari pihak atau lembaga pendidikan maupun pemerintahan baik dari dalam maupun luar negeri.
2. Kegiatan kampus, yaitu berita mengenai berbagai macam kegiatan baik formal maupun nonformal yang diadakan oleh setiap fakultas dan departemen.
3. Riset, yaitu berita mengenai informasi tentang penelitian yang dilakukan oleh para staff dosen di lingkungan IPB.
2. Prototipe I
2.1 Perancangan Cepat Prototipe
Tahap awal yaitu dengan membuat prototipe dari sistem aggregator untuk mendapatkan gambaran tentang sistem yang akan dibuat, bagaimana aggregator dapat menampilkan isi berita dari feed yang berupa file dalam bentuk XML. Prototipe sistem tidak menggunakan data
real sehingga xml tidak diambil langsung dari situs terkait, akan tetapi file XML juga dibuat prototipenya menggunakan struktur XML standard.
Sistem ini dibuat menggunakan dua kondisi
yaitu offline dan online, yang mana untuk kondisi offline, berita dalam format XML diambil dari direktori sistem yang sebelumnya format XML tersebut telah diunduh, dan pada kondisi online, XML berita diambil langsung dari situs yang feed-nya telah didaftarkan sebelumnya dan disimpan ke dalam database
sistem. Untuk status offline XML yang dipakai diambil dari Fakultas Ekologi Manusia (FEMA) (http://fema.ipb.ac.id), Fakultas Kehutanan (FAHUTAN) (http://fahutan.ipb.ac.id) dan dari Departemen Ilmu Keluarga dan Konsumen (IKK) Fakultas Ekologi Manusia (FEMA) (http://ikk.fema.ipb.ac.id).
2.2 Analisis
Dari hasil studi yang dilakukan, dapat ditentukan metode pengklasifikasian berita yaitu menggunakan metode klasifikasi KNN ( k-Nearest Neighbor), berdasarkan metode pengumpulan berita yang digunakan yaitu metode Single Stream Aggregator, dimana cara kerja metode ini menempatkan berita terbaru pada posisi teratas yang mana berita-berita diambil dari beberapa situs dan metode ini juga mengklasifikasikan berita-beritanya. Untuk tahap klasifikasi, berita yang dijadikan sebagai dokumen latih adalah file berita yang di unduh dari mesin pencari Google, dimana file masih berbentuk halaman HTML yang didapat dari situs berita terkait dari situs apa saja, file
kemudian disimpan dan diubah ke dalam bentuk
file teks. Untuk data latih digunakan 10 dokumen berita untuk masing-masing kategori, sehingga jumlah keseluruhan adalah 30 dokumen. Untuk file berita dapat dilihat pada lampiran 14. Untuk data uji digunakan file
berita sebanyak 30 dokumen diambil dari situs fakultas dan departemen, yang mana file XML dari ke-30 dokumen diunduh dan disimpan dalam direktori htdocs karena sistem dijalankan pada keadaan offline.
Untuk menentukan kategori dari suatu dokumen uji dilakukan beberapa tahapan, dimana untuk setiap dokumen berita baik dokumen latih maupun uji sistem akan melakukan proses parsing untuk kemudian akan dibuang kata-kata yang tidak penting (stopwords). Ada sebanyak 332 kata stopwords
yang digunakan yang diambil dari situs http://fpmipa.upi.edu/staff/yudi/stop_words_list.
txt, semua stopwords dapat dilihat pada
dibuat oleh Iqbal (2010), mengkonversi
stemming ke dalam bahasa pemrograman PHP. Proses ini adalah pembuangan imbuhan baik awalan maupun akhiran, daftar imbuhan-imbuhan disimpan dalam database sistem. Kata-kata yang telah didapatkan kata dasarnya akan dicocokkan dengan kata-kata yang telah tersimpan dalam database sesuai dengan kata-kata dalam KBBI. Kata-kata-kata yang telah didapat dari 30 dokumen latih adalah untuk dijadikan sebagai kata-kata penciri dari setiap kategori berita. Setelah dihitung frekuensinya semua kata dan nilai frekuensinya kemudian disimpan ke dalam database sistem, sehingga jika ada dokumen uji yang akan ditentukan kelasnya maka dari setiap kata dari dokumen uji akan dilakukan perhitungan jarak dari semua kata dokumen latih yang telah tersimpan di database
dengan menggunakan persamaan (1). Setelah didapatkan nilai jarak masing-masing kata, diambil k jarak terpendeknya dan dari k jarak tersebut dilihat pola kelas terbanyak sehingga dokumen uji akan dapat diketahui kelasnya.
2.3 Desain Antarmuka Sistem
Sistem aggregator ini memiliki tampilan antarmuka yang dirancang sederhana sehingga diharapkan dapat mempermudah pengguna dalam menjalankan sistem. Ada dua bagian antarmuka yaitu untuk pengguna biasa dan pengguna admin. Dimana untuk pengguna biasa, interkasi yang dapat dilakukan adalah melihat berita yang ditampilkan pada halaman utama dan melihat berita pada halaman kategori. Gambar 9 merupakan antarmuka untuk pengguna biasa.
Gambar 9 Rancangan Antarmuka Frontend
Terdapat beberapa bagian tampilan antarmuka dari sistem aggregator ini:
- Header
Berupa logo IPB dan nama sistem yaitu RSS Aggregator IPB
- Menu
Berupa tab-tab yang dapat dipilih oleh pengguna, dimana tab yang sedang aktif ditandai dengan panah berwarna kuning. Pada sistem ini terdapat tiga tab menu, yaitu
tab Home yang berisi berita-berita, tab IPB yang menghubungkan langsung ke situs Institut Pertanian Bogor dan tab About System yang berisi deskripsi tentang sistem.
- Isi
Berisi tampilan berita-berita dari setiap situs yang feednya telah disubscribe terlebih dahulu. Isi yang ditampilkan berupa judul berita, waktu posting, deskripsi berita, sumber berita dan link yang menuju ke berita selengkapnya. Berdasarkan metode yang digunakan, nantinya secara otomatis kategori yang telah ditentukan yaitu kategori berita tentang Beasiswa, Kegiatan Kampus, dan Riset. Pemilihan kategori berita ditentukan berdasarkan berita yang paling banyak diposting oleh setiap pengelola situs fakultas dan departemen pada tahap analisis sebelumnya.
- Kolom Profil
Berisi profil tentang penulis.
- Footer
Berisi tab-tab menu sama seperti menu di atas.
Gambar 10 Rancangan Antarmuka Backend
Berikut keterangan bagian tampilan untuk Form
Admin : dapat dilihat pada halaman lampiran.
- Isi
1. Menambah URL RSS feed
2. Menambah kategori berita
3. Menghapus kategori berita
3. Pembentukan Prototipe
Setelah mendapatkan hasil pada tahapan perancangan sebelumnya, maka dapat dilakukan implementasi untuk pembentukan prototipe yaitu mengkodekan sistem dengan menggunakan bahasa pemrograman PHP dan
template engine Smarty untuk memisahkan kode PHP dan HTML. Selama pengerjaan sistem dijalankan pada keadaan offline.
Hasil prototipe sistem Aggregator dapat dilihat pada Gambar 11.
Gambar 11 Hasil prototipe
3.1 Implementasi Antarmuka
Sistem ini dirancang memliki dua tampilan yaitu frontend dan backend. Pada frontend yaitu untuk pengguna biasa, hanya menerima keluaran dari sistem yaitu berupa berita-berita baik yang tidak terklasifikasi maupun yang telah terklasifikasi. Pada backend yaitu bagian yang hanya diakses seorang admin dan tersedia berbagai konfigurasi untuk mengelola sistem ini.
Antarmuka yang dibuat berupa antarmuka grafis yang memudahkan pengguna untuk berinterkasi dengan sistem. Frontend (halaman utama) sistem dapat dilihat pada Gambar 12.
Gambar 12 Frontend
Gambar 13 Backend
3.2 Lingkungan Implementasi
Perangkat yang digunakan dalam pembentukan sistem adalah:
Hardware yang digunakan:
- Processor Intel Core 2 Duo 2.13 GHz
- RAM 2 GB
- Harddisk 160 GB
Software yang digunakan:
- Apache 1.7.2a
- Adobe Dreamweaver CS4
- Adobe Photoshop CS4
- MySQL
Gambar 14 Software feed validator
Pada prototipe pertama feed yang tidak valid yaitu situs PSP dan situs IPB yang menyebabkan hasil berita yang ditampilkan menjadi kurang baik. Tampilan pengujian untuk valid dan tidak validnya feed dapat dilihat pada Lampiran 1 dan Lampiran 2.
Beberapa kesalahan keluaran yang disebabkan oleh feed yang tidak valid seperti terlihat pada Gambar 15.
Gambar 15 karakter Ugly dan Tag HTML
Ada beberapa berita yang isinya terdapat kode-kode HTML dan karakter-karakter ugly
atau karakter yang tidak pantas ada di feed,
karena feed RSS seharusnya bersih dari kode-kode HTML dan karakter ugly.
Kesalahan tampilan yang lain seperti pada Gambar 16. Hal ini disebabkan oleh dari salah satu feed ada yang tidak memiliki isi berita, atau dengan kata lain feed-nya kosong (hal ini tidak selalu terjadi) dan tidak seharusnya feed tidak memiliki isi.
Gambar 16 feed kosong
Tabel 2 Test Case 1 pengujian feed, digunakan software yang sudah ada, yang mana input yang diberikan adalah berupa URL atau link yang berisi feed dari situs yang ingin didaftarkan sebelumnya, maka jika seseorang memasukkan feed yang valid maka
akan muncul pemberitahuan
“Congratulation!...” selengkapnya pada Lampiran 1, dan jika yang dimasukkan adalah
feed yang tidak valid maka pemberitahuan yang muncul adalah “Sorry. …”, tampilan juga dapat dilihat pada halaman lampiran. Ada beberapa
feed yang tidak valid pada evaluasi prototipe pertama.
Evaluasi juga dilakukan pada form login administrator (antarmuka backend), dimana jika seorang admin memasukkan username dan lampiran 5. Kedua kasus di atas telah berhasil dijalankan.
4. Prototipe II
4.1 Perancangan Cepat Prototipe II
Tanpa mengubah tampilan antarmuka sistem dan perancangan basis data yang sebelumnya, pada tahap perancangan yang kedua simulasi tetap dijalankan pada keadaan offline dengan menggunakan file xml yang sama. Perancangan pada tahap ini tidak ada yang berbeda dengan perancangan pada prototipe pertama.
4.2 Pembentukan Prototipe II
Pembentukan pada prototipe yang kedua yaitu melakukan pengkodean ulang pada sistem untuk mendapatkan hasil yang lebih baik, yaitu membersihkan karakter ugly dan tag HTML yang sebelumnya terdapat pada hasil prototipe pertama. Ada perbedaan pada prototipe kedua yaitu untuk file xml diambil dari situs yang berbeda dengan prototipe pertama, yaitu:
- http://fapet.ipb.ac.id
- http://fahutan.ipb.ac.id
- http://ikk.fema.ipb.ac.id
Perubahan data ini dikarenakan adanya beberapa perbaikan dari website tersebut selama dilakukan penelitian ini, sehingga data tidak bisa lagi digunakan.
Sama seperti pembentukan prototipe pertama, masing-masing feed juga akan diuji validitasnya dengan menggunakan software
yang sama yaitu Feed Validator, dan dari ketiga
feed yang digunakan pada prototipe kedua ini semuanya adalah feed yang valid.
4.3 Evaluasi
Untuk hasil pembentukan prototipe kedua, setelah dilakukan perbaikan dapat dilihat tidak terdapat karakter-karakter ugly pada semua berita yang ditampilkan, hasil yang diperoleh dapat lebih optimal seperti yang ditunjukkan pada Gambar 17.
Gambar 17 feed yang valid
Password halaman admin tidak ada kesalahan yang terjadi pada evaluasi pembentukan prototipe yang mengetahui dokumen-dokumen yang salah diklasifikasikan digunakan matrix confusion
seperti pada Tabel 4. Pengujian dilakukan dengan kondisi offline untuk nilai k=5.
Tabel 4 Matrix Confusion
Kelas hasil prediksi
Kelas aktual
Kelas 1 Kelas 2 Kelas 3
Kelas 1 9 1 0
Kelas 2 4 3 3
Kelas 3 2 4 4
Berdasarkan Tabel 4 Matrix Confusion data yang tepat diklasifikasi sebagai kelas 1 sebanyak 9 dokumen. Kelas 1 yang salah diklasifikasi sebagai kelas 2 sebanyak 1 dokumen dan tidak ada dokumen berita kelas 1 yang salah diklasifikasikan sebagai kelas 3. Kelas 2 yang salah diklasifikasi sebagai kelas 1 sebanyak 4 dokumen. Kelas 2 yang tepat diklasifikasi sebagai kelas 2 sebanyak 3 dokumen, dan kelas 2 yang salah diklasifikasi sebagai kelas 3 sebanyak 3 dokumen. Kelas 3 yang salah diklasifikasi sebagai kelas 1 sebanyak 2 dokumen. Kelas 3 yang salah diklasifikasi sebagai kelas 2 sebanyak 4 dokumen, dan kelas 3 yang tepat diklasifikasi sebagai kelas 3 sebanyak 4 dokumen.
Adanya kesalahan klasifikasi pada dokumen-dokumen berita disebabkan oleh perhitungan jarak setiap kata untuk
masing-masing dokumen dengan nilai jarak yang sama, sehingga dokumen bisa berada pada setiap kategori yang berbeda. Untuk proses klasifikasi tidak dilakukan perhitungan bobot setiap kata-kata, sehingga hasilnya menjadi kurang akurat.
Dengan menggunakan persamaan: kinerja pengklasifikasian sistem sebesar 53% .
KESIMPULAN DAN SARAN
Kesimpulan
Perangkat lunak aggregator merupakan fasilitas pengumpulan berita secara otomatis Bogor. User juga dapat mempersempit lingkup berita dengan menyaring berita berdasarkan kategori berita yang ingin ditampilkan sesuai dengan metode pengumpulan Single Stream Aggregation yaitu berita diklasifikasikan dengan dengan metode klasifikasi KNN untuk k=5 menghasikan tingkat akurasi sebesar 53%, dan pengurutan tampilan beritanya berdasarkan waktu terbaru telah berhasil dilakukan.
Saran
Untuk pengembangan yang selanjutnya, ada beberapa saran yang dapat ditambahkan ke dalam sistem, diantaranya :
1. Menggunakan metode aggregator yang lain dalam menampilkan berita-berita, karena ada beberapa metode lainnya selain Single Stream Aggregation. Seperti: Single Page Aggregation, Meme Aggregation, People Powered Aggregation, dan Edited Aggregation.
2. Menambahkan fitur statistik berupa grafik yang dapat memberikan informasi tentang intensitas update berita fakultas atau departemen yang berada di Institut Pertanian Bogor.
DAFTAR PUSTAKA
Catone J, 2007. 5 News Aggregation Methods Compared. http://www.readwriteweb.com. Agustus. 2009.
Faiza NN. 2009. Prediksi Tingkat Keberhasilan Mahasiswa Tingkat I Dengan Metode k-Nearest Neighbor. [Skripsi]. Bogor. Institut Pertanian Bogor.
Gralla P. 2006. How the Internet Works /
Preston Gralla, Michael Troller. 8th Ed.
United States of America. Que Publishing.
Iqbal R. 2010. Pengembangan Stemmer
Berbasis Kamus Besar Basaha Indonesia [Skripsi]. Bogor. Institut Pertanian Bogor.
Madnick S, Siegel M. 2001. Seizing the Opportunity: Exploiting Web Aggregation.
Cambridge, Massachusetts Institute of Technology.
McLeod R, Schell G. Sistem Informasi Manajemen. Ed ke-8. Prentice Hall, Inc. 2001.
Ridok A, et all. 2010. Pengelompokan Dokumern Berbahasa Indonesia Menggunakan Metode K-NN [Paper]. Malang. Universitas Brawijaya.
Rismawan T, et all. 2008. Sistem Pendukung Keputusan Berbasis Pocket PC Sebagai Penentu Status Gizi menggunakan Metode KNN (K-Nearest Neighbor) [Paper]. Yogyakarta. Universitas Islam Indonesia.
Salim B, et all. 2007. Analisis dan Perancangan Aplikasi RSS Aggregator Berbasis Web 2.0 [Skripsi]. Jakarta: Universitas Bina Nusantara.
Sommerville I. 2001. Software Engineering. 6th
Edition. Addison-Wesley.
Lampiran 3 Struktur file RSS Feed
<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
xmlns:content="http://purl.org/rss/1.0/modules/content/"
xmlns:wfw="http://wellformedweb.org/CommentAPI/"
xmlns:dc="http://purl.org/dc/elements/1.1/"
xmlns:atom="http://www.w3.org/2005/Atom"
xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
>
<channel>
<title>Fakultas Ekologi Manusia - Institut Pertanian Bogor » Agenda Kegiatan</title>
<atom:link href="http://fema.ipb.ac.id/index.php/category/agenda-kegiatan/feed/" rel="self" type="application/rss+xml" />
<link>http://fema.ipb.ac.id</link>
<description>"MEMBUMI DAN MENDUNIA"</description>
<lastBuildDate>Tue, 29 Mar 2011 03:19:59 +0000</lastBuildDate>
<language>en</language>
<sy:updatePeriod>hourly</sy:updatePeriod>
<sy:updateFrequency>1</sy:updateFrequency>
<generator>http://wordpress.org/?v=3.0.3</generator>
<item>
<title>22 Februari: Pelatihan Persiapan Memasuki Dunia Kerja</title>
<link>http://fema.ipb.ac.id/index.php/22-februari-pelatihan-persiapan-memasuki-dunia-kerja/</link>
<comments>http://fema.ipb.ac.id/index.php/22-februari-pelatihan-persiapan-memasuki-dunia-kerja/#comments</comments>
<pubDate>Thu, 17 Feb 2011 01:12:51 +0000</pubDate>
<dc:creator>FEMA IPB</dc:creator>
<category><![CDATA[Agenda Kegiatan]]></category>
<category><![CDATA[Fakultas Ekologi Manusia]]></category>
<category><![CDATA[FEMA]]></category>
<category><![CDATA[IPB]]></category>
<guid isPermaLink="false">http://fema.ipb.ac.id/?p=1525</guid>
<description><![CDATA[Fakultas Ekologi Manusia IPB mengundang para lulusan yang mengikuti wisuda Tahap III IPB untuk menghadiri acara” Pelatihan Persiapan Memasuki Dunia Kerja” yang akan dilaksanakan pada: Hari/Tanggal: Selasa, 22 Februari 2011... <a class="meta-more"
href="http://fema.ipb.ac.id/index.php/22-februari-pelatihan-persiapan-memasuki-dunia-kerja/">Read more <span class="meta-nav">»</span></a>]]></description>
<content:encoded><![CDATA[<p><a href="http://fema.ipb.ac.id/wp-content/uploads/2011/02/pelatihan-dunia-kerja.jpg"><img class="alignright size-medium wp-image-1528" title="pelatihan dunia kerja"
src="http://fema.ipb.ac.id/wp-content/uploads/2011/02/pelatihan-dunia-kerja-138x190.jpg" alt="" width="138" height="190" /></a>Fakultas Ekologi Manusia IPB mengundang para lulusan yang mengikuti wisuda Tahap III IPB untuk menghadiri acara” Pelatihan Persiapan Memasuki Dunia Kerja” yang akan dilaksanakan pada:</p>
<ul>
<li>Hari/Tanggal: Selasa, 22 Februari 2011</li>
<li>Waktu: Pukul 09.00 sd selesai</li>
<li>Tempat: Ruang Rapat Besar FEMA IPB</li>
<li>Pembicara: Retna Widayawati (Account Director of Prudential)</li>
</ul>
<p>Atas perhatian dan kehadirannya, disampaikan ucapan terimakasih.</p>
]]></content:encoded>
<title>[20 - 23 Desember] Pekan Ekologi Manusia</title>
<link>http://fema.ipb.ac.id/index.php/20-23-desember-pekan-ekologi-manusia/</link>
<comments>http://fema.ipb.ac.id/index.php/20-23-desember-pekan-ekologi-manusia/#comments</comments>
<pubDate>Mon, 20 Dec 2010 01:51:11 +0000</pubDate>
<dc:creator>FEMA IPB</dc:creator>
<category><![CDATA[Agenda Kegiatan]]></category>
<category><![CDATA[ekologi manusia]]></category>
<category><![CDATA[pekan ekologi manusia]]></category>
<guid isPermaLink="false">http://fema.ipb.ac.id/?p=1433</guid>
<description><![CDATA[Pekan Ekologi Manusia (PEM) merupakan kegiatan rutin sebagai akhir dari penyelenggaraan kuliah MK. Ekologi Manusia yang di ampu oleh Departemen Sains Komunikasi dan Pengembangan Masyarakat. Kegiatan berupa pameran tentang hasil... <a class="meta-more" href="http://fema.ipb.ac.id/index.php/20-23-desember-pekan-ekologi-manusia/">Read more <span
<content:encoded><![CDATA[<p><a href="http://fema.ipb.ac.id/content/uploads/2010/12/edit_DSC02695.jpg"><img class="alignright size-medium wp-image-1447" title="edit_DSC02695"
src="http://fema.ipb.ac.id/wp-content/uploads/2010/12/edit_DSC02695-253x190.jpg" alt="" width="253" height="190" /></a>Pekan Ekologi Manusia (PEM) merupakan kegiatan rutin sebagai akhir dari penyelenggaraan kuliah MK. Ekologi Manusia yang di ampu oleh Departemen Sains Komunikasi dan Pengembangan Masyarakat. Kegiatan berupa pameran tentang hasil riset yang dilakukan oleh mahasiswa tentang ekologi manusia.</p>
<p>Nama Acara:</p>
<p>Pekan Ekologi Manusia</p>
<p>Waktu:</p>
<p>20 Desember 2010 sd 23 Desember 2010</p>
<p>Tempat:</p>
<p>Koridor FEMA IPB, Kampus IPB Darmaga</p>
]]></content:encoded>
<wfw:commentRss>http://fema.ipb.ac.id/index.php/20-23-desember-pekan-ekologi-manusia/feed/</wfw:commentRss>
<slash:comments>0</slash:comments>
</item>
</channel>
Lampiran 11 Perancangan Database RSS
Tabel Categories
no Field Tipe Keterangan
1 Category_id Int(11) Id kategori
2 Name Varchar(300) Nama kategori
Tabel Feeds
No Field Tipe Keterangan
1 Feed_id Int(11) Id feed
2 url Varchar(400) alamat situs feed
Tabel Users
No Field Tipe Keterangan
1 User_id Int(11) Id administrator
2 nama Varchar(200) Nama administrator
3 email Varchar(200) Email administrator
Lampiran 12 Struktur Database RSS
Nama tabel Nama tabel
categories Berisi kategori berita
feed Berisi url dari situs yang menyediakan feed RSS
users Berisi username dan password administrator
frequency berisi file_id, category_id, frekuensi setiap kata
dan semua kata dari setiap dokumen
files semua file atau dokumen yang disimpan yang
akan dijadikan sebagai data training.
entry berisi daftar kata atau Kamus
Lampiran 13 Stopwords (http://fpmipa.upi.edu/staff/yudi/stop_words list.txt)
Lampiran 14 Daftar Berita
Berita Beasiswa
1. Beasiswa Master di Wageningen University
2. Tawaran Beasiswa dari Pemerintah Romania
3. Beasiswa Triputra Group Scholarship Program
4. Beasiswa PhD ke Hongkong
5. Pendaftaran Beasiswa S2/S3 Luar Negri Ditjen Dikti gelombang 5 alokasi tahun 2011
6. Beasiswa S3
7. Fulbright Scholarship
8. Beasiswa Depkominfo
9. Beasiswa dari Yayasan Beasiswa Jakarta (YBJ)
10. Tawaran Beasiswa dari Pemerintah Belanda
Berita Riset
1. Hasil Seleksi Proposal Program Hibah Desentralisasi T.A. 2011
2. Pendaftaran Program Academic Recharging
3. Teknis Baru Proposal BIC
4. Insentif Penulisan buku ajar 2010 : Revisi
5. Program Hibah Pengembangan Himpunan Profesi Tahun 2010
6. Undangan Usulan Proposal Program Hibah Kemitraan (HI-LINK) Tahun 2010
7. Program Bantuan Seminar Luar Negeri Bagi Peneliti/Dosen di Perguruan Tinggi
8. Pelatihan Penulisan Artikel Ilmiah Tahun 2010
9. Insentif Penulisan Buku Ajar 2010
10. Program Bantuan Penulisan/Publikasi Artikel Ilmiah Pada Berkala Bereputasi Internasional Tahun 2010
Berita Kampus
1. 22 Februari : Pelatihan Persiapan Memasuki Dunia Kerja
2. [20 – 23 Desember] Pekan Ekologi Manusia
3. Seminar Food Estate di Indonesia
4. Workshop Manajemen Pendidikan Tinggi
5. Seminar Hasil-hasil Penting Riset Bidang Sosiologi Program STORMA
6. Simposium dan Kongres Perhimpunan Penyuluhan Pembangunan Indonesia (PAPPI)
7. [03 November 2009] Studium Generale : Dirjen Dikti Depdiknas dan Gubernur Jawa Barat
8. [26 Agustus 2009] Workshop Sosialisasi Pancasila
9. [Jumat, 7 Agustus 2009] Pembukaan Dies ke-4 FEMA IPB
Lampiran 15 Berita Hasil Klasifikasi
Berita Beasiswa
1. Fulbright Scholarship
2. Beasiswa Depkominfo
3. Beasiswa Master di Wageningen University
4. Beasiswa dari Yayasan Beasiswa Jakarta (YBJ)
5. Tawaran Beasiswa dari Pemerintah Belanda
6. Tawaran Beasiswa dari Pemerintah Romania
7. Beasiswa Triputra Group Scholarship Program
8. Beasiswa PhD ke Hongkong
9. Beasiswa S3
10. Pendaftaran Beasiswa S2/S3 Luar Negri Ditjen Dikti gelombang 5 alokasi tahun 2011
Berita Riset
1. 22 Februari : Pelatihan Persiapan Memasuki Dunia Kerja
2. Beasiswa PhD ke Hongkong
3. Seminar Food Estate di Indonesia
4. Insentif Penulisan buku ajar 2010 : Revisi
5. Program Hibah Pengembangan Himpunan Profesi Tahun 2010
6. Undangan Usulan Proposal Program Hibah Kemitraan (HI-LINK) Tahun 2010
7. Pelatihan Penulisan Artikel Ilmiah Tahun 2010
8. Program Bantuan Seminar Luar Negeri Bagi Peneliti/Dosen di Perguruan Tinggi
9. Insentif Penulisan Buku Ajar 2010
10. Hasil Seleksi Proposal Program Hibah Desentralisasi T.A. 2011
Berita Kampus
1. 22 Februari : Pelatihan Persiapan Memasuki Dunia Kerja
2. [20 – 23 Desember] Pekan Ekologi Manusia
3. Workshop Manajemen Pendidikan Tinggi
4. Pendaftaran Beasiswa S2/S3 Luar Negri Ditjen Dikti gelombang 5 alokasi tahun 2011
5. Beasiswa S3
6. Simposium dan Kongres Perhimpunan Penyuluhan Pembangunan Indonesia (PAPPI)
7. [Jumat, 7 Agustus 2009] Pembukaan Dies ke-4 FEMA IPB
8. [26 Agustus 2009] Workshop Sosialisasi Pancasila
9. [Jumat, 7 Agustus 2009] Pembukaan Dies ke-4 FEMA IPB