BAB V KESIMPULAN DAN SARAN
V.2 Saran
Adapun saran untuk pengembangan lebih lanjut mengenai sistem news aggregator ini adalah sebagai berikut :
1. Hasil pengelompokkan dengan K-Means pada sistem news aggregator
masih membutuhkan evaluasi lagi dikarenakan proses pembentukan
cluster yang berdasarkan inisialisasi secara dinamis ini terkadang menghasilkan over cluster jika jumlah dokumennya semakin banyak, sehingga diharapkanmenggunakan jenis metode clustering yang lain yang tidak sensitif terhadap inisialiasi atau menggunakan metode lain yang dapat menentukan inisialisasi secara dinamis.
2. Perbaikan pada fungsional crawling saat melakukan proses pengambilan informasi berita dari situs berita karena sistem news aggregator ini hanya mengambil deskripsi atau headlines yang tersedia pada situs berita, sehingga sistem ini diharapkan dapat ditambahkan fungsi dari PHP, yaitu cURL yang untuk pengambilan informasi full content.
Kelurahan Dago Kecamatan Coblong Bandung 40135 Phone : +6285721398724 Email : [email protected]
Personal Information
Place & D.O.B : Prabumulih, October 03rd 1993 Marital Status : Single
Religion : Islam
Languages Known : Palembang, Indonesian, English, Sunda, Arab
Formal Education
Indonesia Computer University Majoring Informatics Engineering 2011 – 2015SMA Darul Hikam 2008 – 2011
SMP YPS Prabumulih 2005 – 2008
SD YKPP II Prabumulih 1999 – 2005
TK Tunas Harapan I YKPP 1997 – 1999
Professional Experiences
October 2012 – September 2013
- Assistant teacher and Operator Computer Lab. in SMP Darul Hikam
Projects Experience
DESKTOP APPLICATIONS
Data Management Program using Single Linked List with Pascal (console)
Program Management of data items with Pascal (console)
Application Supermarket Management System with C#
Application Information System Hospital with Delphi
Skills
Operating System : Microsoft Windows XP Microsoft Windows 7 Microsoft Windows 8 Linux Ubuntu 10
Integrated Development Environment : Macromedia Dreamweaver 8 Adobe Photoshop CS5 Corel Draw X6 (Beginer) Eclipse
Microsoft Visual Studio 2012 Ultimate Microsoft Office 2003/2007/2010/2013 Matlab 2010 Dev C++ Dev Pascal Borland Delphi Git Bash (Beginner) MySQLyog
Xamp Server / Wamp Server
Text Editor : Notepad++
Notepad Programming Language : HTML CSS Javascript PHP C / C++ / C# Matlab Pascal Delphi (beginner)
SKRIPSI
Diajukan Untuk Menempuh Ujian Akhir Sarjana
ACHMAD THORIQ BAIDOWI
10111545
PROGRAM STUDI TEKNIK INFORMATIKA
FAKULTAS TEKNIK DAN ILMU KOMPUTER
UNIVERSITAS KOMPUTER INDONESIA
2015
v
DAFTAR ISI
ABSTRAK ... i
ABSTRACT ... ii
KATA PENGANTAR ... iii
DAFTAR ISI ... v
DAFTAR GAMBAR ... viii
DAFTAR TABEL ... xi
DAFTAR SIMBOL ... xiii
DAFTAR LAMPIRAN ... xvi
BAB I PENDAHULUAN ... 1
I.1 Latar Belakang Masalah ... 1
I.2 Perumusan Masalah ... 2
I.3 Maksud dan Tujuan ... 2
I.4 Batasan Masalah... 3
I.5 Metodologi Penelitian ... 3
I.5.1 Metode Pengumpulan Data ... 3
I.5.2 Metode Pembangunan Perangkat Lunak ... 4
I.6 Sistematika Penulisan ... 4
BAB II LANDASAN TEORI ... 7
II.1 Web Mining ... 7
II.1.1 Web Content Mining (WCM) ... 7
II.1.1.1 Teknik Web Content Mining ... 9
II.1.2 Web Structure Mining (WSM) ... 10
II.1.3 Web Usage Mining (WUM) ... 10
II.2 Text Mining ... 11
II.2.1 Tahap Text Mining ... 11
II.3 Clustering Dokumen ... 13
II.4 K-Means ... 14
vi
II.5.1 Algoritma Web Crawler ... 16
II.5.1.1 Breadth First Crawler ... 17
II.5.2 Robot Protocol [13] ... 18
II.6 Tools ... 18
II.6.1 PHP [14] ... 18
II.6.1.1 Berbagai Macam Versi PHP ... 19
II.6.2 Unified Modelling Language (UML) [15] ... 20
II.6.2.1 Diagram UML... 20
II.6.3 Pengujian Validasi ... 21
II.6.4 Pengujian Akurasi ... 22
II.6.5 Pengujian Beta ... 23
BAB III ANALISIS DAN PERANCANGAN SISTEM ... 25
III.1 Analisis Sistem ... 25
III.1.1 Analisis Masalah ... 25
III.1.2 Analisis Data ... 25
III.1.3 Analisis Metode Web Content Mining ... 26
III.1.3.1 Tahap Crawling ... 27
III.1.3.2 Tahap Penghapusan tag HTML ... 29
III.1.3.3 Tahap Tokenizing ... 29
III.1.3.4 Tahap Filtering ... 31
III.1.3.5 Tahap Stemming ... 33
III.1.3.6 Tahap Analyzing ... 34
III.1.3.7 Tahap Clustering... 37
III.1.3.8 KeluaranSistem News Aggregator ... 43
III.2 Spesifikasi Perangkat Lunak ... 43
III.3 Analisis Kebutuhan Non Fungsional ... 44
III.3.1.1 Analisis Kebutuhan Perangkat Lunak... 44
III.3.1.2 Analisis Kebutuhan Perangkat Keras ... 45
III.3.1.3 Analisis Kebutuhan Pengguna ... 45
vii
III.5 Analisis Kebutuhan Fungsional ... 47
III.5.1.1 Use Case Diagram ... 47
III.5.1.2 Use Case Scenario ... 49
III.5.1.3 Activity Diagram ... 54
III.5.1.4 Class Diagram ... 60
III.5.1.5 Sequence Diagram ... 61
III.6 Perancangan Data ... 68
III.7 Perancangan Struktur Menu ... 71
III.8 Perancangan Antarmuka ... 71
III.9 Perancangan Pesan ... 79
III.10 Jaringan Semantik ... 81
BAB IV IMPLEMENTASI DAN PENGUJIAN SISTEM ... 83
IV.1 Implementasi Sistem ... 83
IV.1.1 Implementasi Basis Data ... 83
IV.1.2 Implementasi Antarmuka ... 85
IV.2 Pengujian Sistem ... 87
IV.2.1 Pengujian Black box ... 87
IV.2.1.1 Skenario Pengujian ... 87
IV.2.1.2 Kasus dan Hasil Pengujian ... 88
IV.2.1.3 Kesimpulan Pengujian Black box ... 93
IV.2.2 Pengujian Akurasi ... 93
IV.2.3 Pengujian Beta ... 95
BAB V KESIMPULAN DAN SARAN ... 97
V.1 Kesimpulan ... 97
V.2 Saran ... 97
98 Kecendrungan Berita,” 2008.
[2] R. Henjaya, “Penerapan Algoritma K-Means Pada Clustering Berita Berbahasa Indonesia,” UPI, Bandung, 2010.
[3] A. Karhendana, “Pemanfaatan Document Clustering Pada Agregator Berita,” ITB, Bandung, 2008.
[4] D. W. Suliantoro, I. Wisnubhadra dan E. , “Integrasi Pembobotan TF-IDF Pada Metode K-Means Untuk Clustering Dokumen Teks,” Prosiding Seminar Nasional Manajemen Teknologi XV, pp. C-1-1 - C-1-8, 2012. [5] R. S dan M. Shalahuddin, Rekayasa Perangkat Lunak, Informatika, 2013. [6] B. Liu, Web Data Mining, vol. 2, Chicago: Springer, 2007, pp. 6-7.
[7] O. Maimon dan L. Rokach, “Web Mining,” dalam Data Mining And Knowledge Discovery Handbook, Israel, Springer, 2010, p. 914. [8] S. Balan dan P. Ponmuthuramalingam, “A Study of Various Techniques of
Web Content Mining Research Issues and Tools,” International Journal of Innovative Research & Studies (IJIRS), vol. 2, no. 5, pp. 508-517, 2013.
[9] R. Feldman dan J. Sanger, The Text Mining HandBook, Cambridge University Pres, 2007.
[10] “Wikibooks,” [Online]. Available:
https://en.wikibooks.org/wiki/Data_Mining_Algorithms_In_R/Cluster ing/K-Means. [Diakses 16 June 2015].
[11] E. Zuliarso dan K. Mustofa, “Crawling Web berdasarkan Ontology,” Jurnal Teknologi Informasi DINAMIK , vol. XIV, no. 2, pp. 105-112, 2009. [12] D. Shestakov, “Intelligent Web Crawling,” Finland, 2013.
99
[15] S. Dharwiyanti dan R. S. Wahono, Pengantar Unified Modeling Language (UML), IlmuKomputer.com, 2003.
[16] R. A. Sukamto dan M. Shalahuddin, Modul Pembelajaran Rekayasa Perangkat Lunak (Terstruktur dan Berorientasi Objek), Bandung: Modula, 2011.
[17] R. Kohavi dan F. Provost, “Special Issue on Applications of Machine Learning and the Knowledge Discovery Process,” Machine Learning,
vol. 30, no. 2-3, pp. 271-274, 1998.
[18] Sugiyono, “Interview (Wawancara),” dalam Metode Penelitian Kuantitatif, Kualitatif dan Kombinasi (Mixed Methods), Bandung, Alfabeta, 2013, p. 188.
iii
Alhamdulillahi Rabbil alamiin, segala puji dan syukur penulis panjatkan kepada Allah SWT atas rahmat dan karunia-Nya yang dilimpahkan, shalwat dan salam tidak lupa dicurahkan kepada Nabi Muhammad SAW, sehingga penulis dapat menyelesaikan skripsi ini yang berjudul “PENERAPAAN WEB CONTENT MINING MENGGUNAKAN PARTITIONAL CLUSTERING K-MEANS PADA NEWS AGGREGATOR”.
Adapun tujuan dari penyusunan skripsi ini adalah untuk memenuhi salah satu syarat dalam menyelesaikan studi jenjang strata satu (S1) di Program Studi Teknik Informatika Universitas Komputer Indonesia.
Dalam penyusunan skripsi ini banyak sekali bantuan yang penulis terima. Karena itu, penulis ingin menyampaikan penghargaan dan terima kasih yang sebesar-besarnya kepada :
1. Allah SWT yang telah mencurahkan rahmat dan hidayah-Nya hingga detik ini.
2. Ibu Nelly Indriani W, S.Si., M.T. selaku dosen pembimbing yang telah banyak memberikan bimbingan dan dorongan kepada penulis selama penyusunan skripsi ini.
3. Bapak Angga Setiyadi, S.Kom. selaku dosen reviewer dan penguji I yang telah memberikan saran serta kritiknya dalam penyempurnaan skripsi ini. 4. Ibu Utami Dewi W, S.Kom., M.Kom. selaku dosen penguji III yang telah
memberikan saran serta kritiknya dalam penyempurnaan skripsi ini.
Salam ini tidak lupa juga penulis ucapkan terima kasih yang sebesar-besarnya dan penghargaan yang setinggi-tingginya kepada :
1. Kepada orang tua dan keluarga besar yang setiap saat selalu mengiringi langkah penulis dengan cinta, perhatian, arahan, kasih sayang serta do’anya yang tiada henti dan tanpa keluh kesah.
iv
Agung atas dukungan dan kebersamaan kita pada saat menunggu bimbingan.
3. Kepada teman-teman kelas IF-12 angkatan 2011 yang telah menemani dalam pelaksanaan seminar skripsi serta membantu penulis untuk bersedia menjadi responden wawancara.
Sebagai manusia penulis yakin bahwa apa yang kita perbuat tidak luput dari kekurangan karena kesempurnaan hanyalah milik Allah SWT. Oleh karena itu, penulis berharap semoga apa yang ditulis dalam skripsi ini dapat bermanfaat serta memberikan masukan yang berarti bagi penulis khususnya dan bagi para pembaca umumnya.
Bandung, Agustus 2015