• Tidak ada hasil yang ditemukan

IMPLEMENTASI ALGORITMA FOCUSED WEB CRAWLING SITUS WEB LOWONGAN PEKERJAAN BERBASIS WEB SKRIPSI PUTRI MARESNA CHANIA

N/A
N/A
Protected

Academic year: 2022

Membagikan "IMPLEMENTASI ALGORITMA FOCUSED WEB CRAWLING SITUS WEB LOWONGAN PEKERJAAN BERBASIS WEB SKRIPSI PUTRI MARESNA CHANIA"

Copied!
61
0
0

Teks penuh

(1)

IMPLEMENTASI ALGORITMA FOCUSED WEB CRAWLING SITUS WEB LOWONGAN PEKERJAAN BERBASIS WEB

SKRIPSI

PUTRI MARESNA CHANIA 141401045

PROGRAM STUDI S1 ILMU KOMPUTER

FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI UNIVERSITAS SUMATERA UTARA

MEDAN 2020

Universitas Sumatera Utara

(2)

IMPLEMENTASI ALGORITMA FOCUSED WEB CRAWLING SITUS WEB LOWONGAN PEKERJAAN BERBASIS WEB

SKRIPSI

Diajukan untuk melengkapi tugas dan memenuhi syarat memperoleh ijazah Sarjana Ilmu Komputer

PUTRI MARESNA CHANIA 141401045

PROGRAM STUDI S1 ILMU KOMPUTER

FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI UNIVERSITAS SUMATERA UTARA

MEDAN 2020

Universitas Sumatera Utara

(3)

ii

Universitas Sumatera Utara

(4)

PERNYATAAN

IMPLEMENTASI ALGOTIMA FOCUSED WEB CRAWLING SITUS WEB LOWONGAN PEKERJAAN BERBASIS WEB

SKRIPSI

Saya mengakui bahwa skripsi ini adalah hasil karya saya sendiri, kecuali beberapa kutipan dan ringkasan yang masing-masing telah disebutkan sumbernya.

Medan, Januari 2020

Putri Maresna Chania NIM 141401045

Universitas Sumatera Utara

(5)

PENGHARGAAN

Puji dan syukur kepada Allah SWT atas berkat dan karunia-Nya, sehingga Penulis dapat menyelesaikan skripsi ini sebagai syarat untuk memperoleh gelar Sarjana Komputer pada Program Studi S1 Ilmu Komputer Universitas Sumatera Utara.

Sholawat beriringkan salam selalu tercurahkan kepada Rasulullah SAW, yang kita harapkan syafaat di kemudina hari.

Penulis ingin menyampaikan rasa hormat sekaligus banyak terima kasih kepada : 1. Bapak Prof. Dr. Runtung Sitepu, S.H., M.Hum selaku Rektor Universitas

Sumatera Utara.

2. Bapak Prof. Opim Sitompul, M.Sc., selaku Dekan Fakultas Ilmu Komputer dan Teknologi Informasi Universitas Sumatera Utara.

3. Bapak Dr. Poltak Sihombing, M.Kom selaku Ketua Program Studi S1 Ilmu Komputer Universitas Sumatera Utara.

4. Bapak Herriyance, S.T., M.Kom selaku Sekretaris Program Studi S1 Ilmu Komputer Universitas Sumatera Utara.

5. Ibu Amalia, S.T., M.T selaku pembimbing akademik dan dosen Pembimbing I yang telah memberikan kritik, saran dan dukungan kepada penulis dalam menyelesaikan skripsi ini

6. Bapak Dani Gunawan,S.T., M.T selaku dosen Pembimbing II yang telah memberikan kritik, saran dan dukungan kepada penulis dalam menyelesaikan skripsi ini.

7. Seluruh dosen dan pegawai Program studi S1 Ilmu Komputer Fasilkom-TI USU.

8. Orangtua penulis Masrizal Tanjung dan Ernawati Chan yang selalu mendo’akan, memberikan kasih sayang, semangat dan motivasi kepada penulis dalam menyelesaikan skripsi ini.

9. Saudara kandung penulis, adinda Ardian Ariesandi dan Zellyna Melisa Chania yang telah memberikan semangat, dukungan dan doa kepada penulis.

iv

Universitas Sumatera Utara

(6)

10. Teman-teman penulis. Hanafi Ahmad Subrata Lubis, teman-teman angkatan 2014 khususnya Kom C, pengurus imilkom 2017/2018, team KodeKiddo Medan, yang telah menjadi pengingat, memberikan semangat, ilmu, canda dan tawa kepada penulis.

Penulis menyadari bahwa skripsi ini masih jauh dari sempurna untuk itu penulis menerima kritik dan saran yang membangun untuk menyempurnakan skripsi ini. Dan semoga Tuhan Yang Maha Esa memberikan berkat dan karuniaNya kepada seluruh pihak yang membantu penulis dalam menyelesaikan skripsi ini.

Medan, Januari 2020 Penulis

Putri Maresna Chania

Universitas Sumatera Utara

(7)

IMPLEMENTASI ALGORIMA FOCUSED WEB CRAWLING SITUS LOWONGAN PEKERJAAN BERBASIS WEB

ABSTRAK

Maraknya perkembangan media online dan beragamnya jenis informasi yang terdapat di situs-situs internet seperti lowongan pekerjaan membuat seseorang sulit untuk menemukan situs lowongan pekerjaan yang sesuai dengan yang diinginkan secara tepat. untuk mendapatkan lowongan pekerjaan yang tepat sesuai dengan yang dicari bukan merupakan hal yang mudah, sering kali informasi yang keluar di internet tidak sesuai dengan yang dicari. pencari kerja harus membaca kembali dan memilah informasi lowongan pekerjaan yang keluar diinternet sebanyak mungkin dari berbagai sumber agar dapat menemukan lowongan pekerjaan yang benar- benar sesuai dengan apa yang dicari. Hal tersebut membutuhkan waktu yang lama dan tidak efisien.

Oleh sebab itu, untuk mengatasi masalah tersebut dibutuhkan suatu mekanisme pengumpulan informasi lowongan pekerjaan yang terfokus, akurat dan efisien.

Sistem pencarian tersebut dapat dibangun menggunakan implementasi Focused Web Crawling Algorithm (pencarian yang terfokus, mengumpulkan artikel hanya untuk topik tertentu pada sebuah mesin crawler).

Kata kunci : Algoritma Focused Web Crawling

vi

Universitas Sumatera Utara

(8)

WEB BASED IMPLEMENTATION OF FOCUSED WEB CRAWLING ALGORITHM ON JOB VACANCY WEBSITE

ABSTRACT

The rise of online media development and the variety of types of information contained on internet sites such as job vacancies make it difficult for one to find the job vacancy site that is precisely what is desired. to get the right job vacancy following what is sought is not an easy thing, often the information that comes out on the internet does not match what is sought. job seekers must re-read and sort out job information that comes out on the internet as much as possible from various sources to find job vacancies that match what is sought. This requires a long time and is inefficient.

Therefore, to overcome these problems, a mechanism for gathering information on job vacancies that are focused, accurate and efficient is needed. The search system can be built using a Focused Web Crawling Algorithm implementation (focused the search, gathering articles only for specific topics on a crawler engine).

Keywords : Focused Web Crawling Algorithm

Universitas Sumatera Utara

(9)

DAFTAR ISI

Halaman

Persetujuan... ii

Pernyataan ... iii

Penghargaan... iv

Abstrak... vi

Abstract ... vii

Daftar Isi ... viii

Daftar Tabel ... x

Daftar Gambar ... xi

Daftar Lampiran ... xii

BAB 1 PENDAHULUAN ... 1

1.1. Latar Belakang ... 2

1.2. Rumusan Masalah ... 2

1.3. Tujuan Penelitian ... 2

1.4. Batasan Masalah ... 2

1.5. Manfaat Penelitian ... 3

1.6. Metodologi Penelitian... 3

1.7. Sistematika Penulisan ... 4

BAB 2 LANDASAN TEORI ... 5

2.1. Temu Kembali Informasi ... 5

2.2. Search Engine ... 5

2.3. Cara Kerja Search Engine ... 5

2.4. Focused Web Crawling ... 6

2.4.1. Pengertian Focused Web Crawling ... 6

2.4.2. Kegunaan Focused Web Crawling ... 6

2.4.3. Cara Kerja Focused Web Crawling ... 6

2.5. Algoritma Insertion Sort ... 8

2.6. Penelitian Terdahulu ... 11

BAB 3 ANALISIS DAN PERANCANGAN SISTEM ... 11

3.1. Analisis Sistem ... 11

3.2. Analisis Masalah... 11

3.3. Analisis Kebutuhan... 12

3.3.1 Analisis Kebutuhan Fungsional ... 13

3.3.2 Analisis Kebutuhan Non Fungsional ... 13

3.4. Permodelan Sistem ... 13

3.4.1. Diagram Umum Sistem ... 14

3.4.2. Use Case Diagram ... 15 viii

Universitas Sumatera Utara

(10)

3.4.3. Activity Diagram ... 27

3.4.4. Sequence Diagram ... 18

3.4.5. Flowchart Sistem ... 19

3.5. Perancangan Sistem ... 20

3.5.1. Rancangan Halaman Utama ... 20

3.5.2. Rancangan Halaman Hasil Pencarian ... 21

BAB 4 IMPLEMENTASI DAN PENGUJIAN... 22

4.1 Implementasi Sistem... 22

4.1.1. Proses Implementasi Sistem ... 25

4.2. Implementasi Antarmuka ... 25

4.2.1. Halaman Utama ... 26

4.2.2. Tampilan User Input Keyword ... 27

4.3. Pengujian Sistem ... 27

4.3.1. Pengujian 1... 27

4.3.2. Pengujian 2...30

4.3.3. Pengujian 3...32

4.3.4. Pengujian 4...34

4.3.5. Pengujian 5...36

4.4. Pengujian Yang Tidak Diakomodir Sistem ... 39

4.4.1. Pengujian 1... 39

4.4.2. Pengujian 2...40

4.4.3. Pengujian 3...40

4.4.4. Pengujian 4...42

4.4.5. Pengujian 5... 43

4.4.6. Pengujian 6...44

4.3. Analisis Hasil Evaluasi Keywords ... 44

BAB 5 KESIMPULAN DAN SARAN ... 45

5.1. Kesimpulan ... 45

5.2. Saran ... 45

Daftar Pustaka... 46

Universitas Sumatera Utara

(11)

DAFTAR TABEL

Tabel 3.1. Narasi Input (kata pencarian dan lokasi) ... 19

Tabel 4.1. Hasil Informasi Lowongan Pekerjaan Pengujian 1 ... 32

Tabel 4.2. Hasil Informasi Lowongan Pekerjaan Pengujian 2 ... 34

Tabel 4.3. Hasil Informasi Lowongan Pekerjaan Pengujian 3 ... 37

Tabel 4.4. Hasil Informasi Lowongan Pekerjaan Pengujian 4 ... 39 x

Universitas Sumatera Utara

(12)

DAFTAR GAMBAR

Gambar 2.1. Struktur Focused Web Crawling ... 9

Gambar 2.2. Contoh Algoritma Insertion Sort... 10

Gambar 3.1. Diagram Analisis Masalah ... 14

Gambar 3.2. Diagram Umum Sistem ... 16

Gambar 3.3. Use Case Diagram Fungsional Sistem ... 18

Gambar 3.4. Activity Diagram Fungsional Sistem ... 20

Gambar 3.5. Sequence Diagram Perancangan Analisis Sistem ... 21

Gambar 3.6. Flowchart Perancangan Sistem Penelitian ... 22

Gambar 3.7. Rancangan Tampilan Awal Sistem ... 23

Gambar 3.8. Rancangan Tampilan Halaman Hasil Pencarian ... 23

Gambar 4.1. Tampilan Proses User Input ... 25

Gambar 4.2. Tampilan Konten Target Sistem ... 27

Gambar 4.3. Halaman Utama Sistem Penelitian (desktop version) ... 28

Gambar 4.4. Halaman Utama Sistem Penelitian (mobile phone version) ... 28

Gambar 4.5. Tampilan User Input Keywords (desktop version) ... 29

Gambar 4.6. Tampilan User Input Keywords (mobile phone version) ... 29

Gambar 4.7. Tampilan Halaman Pencarian (user input keywords) ... 30

Gambar 4.8. Tampilan Hasil Informasi Lowongan Kerja (1) ... 30

Gambar 4.9. Tampilan Hasil Informasi Lowongan Kerja (2) ... 31

Gambar 4.10. Tampilan Hasil Informasi Lowongan Kerja (3) ... 31

Gambar 4.11.Tampilan Hasil Informasi Lowongan Kerja (4) ... 31

Gambar 4.12. Tampilan Hasil Informasi Lowongan Kerja (5) ... 32

Gambar 4.13. Tampilan Halaman Pencarian (user input keywords) ... 33

Gambar 4.14. Tampilan Hasil Informasi Lowongan Kerja (1) ... 34

Gambar 4.15. Tampilan Hasil Informasi Lowongan Kerja (2) ... 34

Gambar 4.16. Tampilan Halaman Pencarian (user input keywords) ... 35

Gambar 4.17. Tampilan Hasil Informasi Lowongan Kerja (1) ... 36

Gambar 4.18. Tampilan Hasil Informasi Lowongan Kerja (2) ... 36

Gambar 4.19. Tampilan Hasil Informasi Lowongan Kerja (3) ... 36

Universitas Sumatera Utara

(13)

Gambar 4.20. Tampilan Halaman Pencarian (user input keywords) ... 37

Gambar 4.21. Tampilan Hasil Informasi Lowongan Kerja (1) ... 38

Gambar 4.22. Tampilan Hasil Informasi Lowongan Kerja (2) ... 38

Gambar 4.23. Tampilan Hasil Informasi Lowongan Kerja (3) ... 38

Gambar 4.24. Tampilan Halaman Pencarian (user input keywords) ... 39

Gambar 4.24. Tampilan Hasil Informasi Lowongan Kerja (1) ... 40

Gambar 4.26. Tampilan Hasil Informasi Lowongan Kerja (2) ... 40

Gambar 4.27. Tampilan Hasil Informasi Lowongan Kerja (3) ... 40

Gambar 4.28. Tampilan Hasil Informasi Lowongan Kerja (4) ... 41

Gambar 4.29. Tampilan Hasil Informasi Lowongan Kerja (5) ... 41

Gambar 4.30. Tampilan Hasil Informasi Lowongan Kerja (6) ... 41

Gambar 4.31. Tampilan Halaman Pencarian (user input keywords) ... 42

Gambar 4.32. Tampilan Hasil Informasi Lowongan Kerja ... 42

Gambar 4.33. Tampilan Halaman Pencarian (user input keywords) ... 43

Gambar 4.34. Tampilan Hasil Informasi Lowongan Kerja ... 43

Gambar 4.35. Tampilan Halaman Pencarian (user input keywords) ... 44

Gambar 4.36. Tampilan Hasil Informasi Lowongan Kerja ... 44

Gambar 4.37. Tampilan Halaman Pencarian (user input keywords) ... 45

Gambar 4.38. Tampilan Hasil Informasi Lowongan Kerja ... 45

Gambar 4.39. Tampilan Halaman Pencarian (user input keywords) ... 46

Gambar 4.40. Tampilan Hasil Informasi Lowongan Kerja ... 46

Gambar 4.41. Tampilan Halaman Pencarian (user input keywords) ... 47

Gambar 4.42. Tampilan Hasil Informasi Lowongan Kerja ... 47 xii

Universitas Sumatera Utara

(14)

DAFTAR LAMPIRAN

Lampiran Listing Program ... A-1 Lampiran Daftar Riwayat Hidup ... B-1

Universitas Sumatera Utara

(15)

BAB 1 PENDAHULUAN

1.1. Latar Belakang

Perkembangan internet saat ini yang eksplosif membuat seseorang sangat mudah memperoleh informasi. Namun, informasi yang didapat belum tentu tepat sesuai dengan apa yang diinginkan. Contohnya adalah informasi lowongan pekerjaan. Maraknya perkembangan media online dan beragamnya jenis informasi yang terdapat di situs-situs internet membuat seseorang sulit untuk menemukan situs lowongan pekerjaan yang sesuai dengan yang diinginkan secara tepat.

Untuk mendapatkan lowongan pekerjaan yang tepat sesuai dengan yang dicari bukan merupakan hal yang mudah, sering kali informasi yang keluar di internet tidak sesuai dengan yang dicari. Pencari kerja harus membaca kembali dan memilah informasi lowongan pekerjaan yang keluar diinternet sebanyak mungkin dari berbagai sumber agar dapat menemukan lowongan pekerjaan yang benar-benar sesuai dengan apa yang dicari.

Hal tersebut membutuhkan waktu yang lama dan tidak efisien. Oleh sebab itu, untuk mengatasi masalah tersebut dibutuhkan suatu mekanisme pengumpulan informasi lowongan pekerjaan yang terfokus, akurat dan efisien. Sistem pencarian tersebut dapat dibangun menggunakan implementasi focused web crawling algorithm (pencarian yang terfokus, mengumpulkan artikel hanya untuk topik tertentu pada sebuah mesin crawler).

Pengumpulan artikel dari internet dapat dilakukan dengan menggunakan focused web crawling yang akan mengambil data berdasarkan topik sasaran tertentu, focused web crawling hanya akan terfokus pada link untuk mendapatkan topik sasaran dan menghindari link yang tidak berhubungan dengan topik sasaran. Algoritma ini akan mencari kesamaan dari halaman web yang sedang dicrawl dengan query yang diberikan.

Dan untuk mengurutkan hasil crawling dapat dilakukan dengan menggunakan algoritma insertion sort.

Universitas Sumatera Utara

(16)

Berdasarkan latar belakang yang telah penulis uraikan, maka dilakukan penelitian dengan judul “Implementasi Algoritma Focused Web Crawling Situs Web Lowongan Pekerjaan Berbasis Web”.

1.1. Rumusan Masalah

Informasi lowongan kerja dari berbagai situs web mengharuskan calon pencari kerja harus memilah setiap informasi secara manual karena informasi yang keluar tidak selalu akurat sesuai yang user cari, sehingga waktu yang dibutuhkan untuk mencari informasi lowongan pekerjaan menjadi tidak efisien. Oleh karena itu penelitian ini bertujuan bagaimana mengoptimalkan pencarian situs web informasi lowongan pekerjaan dengan focused crawler, agar yang didapatkan merupakan informasi yang tepat.

1.2. Tujuan Penelitian

Tujuan utama yang ingin dicapai pada penelitian ini adalah menghasilkan informasi lowongan pekerjaan indonesia yang tepat.

1.3. Batasan Masalah

Batasan-batasan masalah pada penelitian ini adalah :

1. Konten informasi yang akan dicrawl adalah konten lowongan pekerjaan di indonesia.

2. Proses crawling bersifat online.

3. Website lowongan pekerjaan indonesia yang dicrawling adalah loker.id, urbanhire.id, dan lokerindonesia.com.

4. Pengurutan hasil crawling berdasarkan judul posisi lowongan pekerjaan.

Universitas Sumatera Utara

(17)

3

1.4. Manfaat Penelitian

Manfaat yang diperoleh dari penelitian ini adalah menciptakan suatu metode untuk pengumpulan artikel lowongan pekerjaan di indonesia.

1.5. Metodologi Penelitian

Metodologi penelitian yang akan digunakan adalah:

1. Studi Pustaka

Pada tahap ini penelitian dimulai dengan peninjauan pustaka berupa mengumpulkan bahan-bahan referensi baik dari buku, artikel, paper, jurnal, makalah, maupun situs-situs internet.

2. Analisis Sistem

Pada tahap ini dilakukan analisis pendekatan pengumpulan situs web dengan menggunakan metode crawling (focused crawling).

3. Perancangan dan Implementasi Sistem

Pada tahap ini dilakukan perancangan sesuai dengan hasil dari analisis sistem dan melakukan implementasi dari hasil analisis dan perancangan yang dibuat.

4. Pengujian Sistem

Pada tahap ini dilakukan proses pengujian dan percobaan terhadap sistem sesuai dengan kebutuhan yang ditentukan sebelumnya serta memastikan program yang dibuat berjalan seperti yang diharapkan.

5. Dokumentasi

Pada tahap ini dilakukan dokumentasi dan penulisan laporan mengenai aplikasi tersebut yang bertujuan untuk menunjukkan hasil penelitian ini.

Universitas Sumatera Utara

(18)

1.6. Sistematika Penulisan

Sistematika penulisan dari skripsi ini terdiri atas lima bagian utama sebagai berikut:

Bab 1: Pendahuluan

Bab ini berisi latar belakang dari penelitian yang dilaksanakan, rumusan masalah, tujuan penelitian, batasan masalah, manfaat penelitian, metodologi penelitian, serta sistematika penulisan.

Bab 2: Landasan Teori

Bab ini berisi teori-teori yang diperlukan untuk memahami permasalahan yang dibahas pada penelitian ini. Teori-teori yang berhubungan dengan Information Retrieval, Search Engine, Web Crawling, Focused Web Crawling, Insertion Sort Algoritm akan dibahas pada bab ini.

Bab 3: Analisis dan Perancangan

Bab ini ini menjelaskan tentang analisis dan perancangan sistem untuk membangun web crawler. Adapun dua tahapan yang dibahas pada bab ini yaitu tahap analisis dan tahap perancangan sistem.

Bab 4: Implementasi dan Pengujian

Bab ini berisi pembahasan tentang implementasi dari perancangan yang telah dijabarkan pada bab 3. Selain itu, hasil yang didapatkan selama proses yang terjadi pada penelitian juga dijabarkan pada bab ini.

Bab 5: Kesimpulan dan Saran

Bab ini berisi ringkasan serta kesimpulan dari rancangan yang telah dibahas pada bab 3, serta hasil penelitian yang dijabarkan pada bab 4, serta pada bagian akhir bab ini akan berisi saran-saran yang diajukan untuk pengembangan penelitian selanjutnya.

Universitas Sumatera Utara

(19)

BAB 2

LANDASAN TEORI

2.1. Temu Kembali Informasi

Temu kembali informasi (information retrieval) yaitu mencari bahan (biasanya dokumen) yang bersifat tidak terstruktur (biasanya teks) untuk memenuhi kebutuhan informasi dari dalam koleksi dokumen yang besar tersimpan dalam komputer. (Manning et al., 2009).

2.2. Search Engine

Search engine (mesin pencari) merupakan fasilitas yang digunakan untuk mengeksplorasi berbagai data, informasi, dan pengetahuan yang ada di internet.

Search engine adalah sebuah program yang dapat diakses melalui internet yang berfungsi untuk membantu pengguna komputer dalam mencari berbagai hal yang ingin diketahuinya. (Indrajit R.E, 2013).

2.3. Cara Kerja Search Engine

Pencarian oleh search engine dilakukan dalam database yang menyimpan text dari masing-masing halaman. Text dari halaman demi halaman disimpan ke dalam server database. Ketika melakukan pencarian, search engine akan melakukan pencarian salinan halaman yang disimpan pada database yang berisi salinan halaman pada saat terakhir dikunjungi. Ketika link yang disediakan diklik maka alamat akan diberikan dari server search engine. Database yang ada pada search engine dipilih dan dijaring oleh program robot yang disebut spider.

Search engine menggunakan web crawl untuk mengumpulkan informasi, dan untuk menentukan halaman potensial, search engine mengacu pada link yang terdapat pada halaman yang telah disimpan di dalam database. (Chyntia Arilla Sembiring, 2014).

Universitas Sumatera Utara

(20)

2.4. Focused Web Crawling

2.4.1. Pengertian Focused Web Crawling

Pada tahun 1999, Soumen Chakrabarti memperkenalkan focused web crawling. Web crawling juga sering disebut sebagai web spider atau web robot, yaitu suatu proses untuk melakuan crawl atau merayapi suatu laman informasi dari suatu website. Tidak hanya merayapi, web crawler juga dapat mengambil halaman informasi dari website tersebut. Dengan focused web crawling memungkinkan crawler menyeleksi halaman- halaman web yang relevan dengan topik tertentu yang telah didefinisikan sebelumnya sehingga crawler tidak mencari seluruh web secara mendalam. Focused crawling memanfaatkan aturan-aturan keputusan berdasarkan pada analisis isi, struktur link dan teks, untuk menjaga agar crawler fokus pada topik tertentu.

2.4.2. Kegunaan Focused Web Crawling

Penerapan focused web crawling digunakan agar proses penelurusan dapat terfokus.

Artinya pada saat proses penelurusan program crawling hanya akan menelusuri link yang terkait dengan halaman konten berita. Sebagai contoh dalam suatu halaman terdapat banyak sekali link, seperti link untuk ke halaman home, link untuk pindah ke kategori lainnya, link konten berita, dsb. Dengan menggunakan focused web crawling, link-link tersebut tidak akan ditelusuri semua, hanya link yang terkait halaman konten berita sasaran (Aad et al., 2016).

2.4.3. Cara Kerja Focused Web Crawling

Focused web crawling menjelajah halaman web khusus untuk topik sasaran. Satu- satunya perbedaan focused web crawling dibandingkan dengan web crawling biasa adalah spesifikasi topik atau topic filtering, yaitu focused web crawling hanya mengambil url pada web page yang berhubungan pada topik sasaran, hal itu membuat focused web crawling akan menghasilkan informasi yang lebih tepat. Jika web page tersebut sesuai dengan topik sasaran, maka link tersebut ditambahkan ke dalam url queue. Jika tidak maka halaman tersebut tidak dilanjutkan (Bhatt et al., 2015).

Universitas Sumatera Utara

(21)

7

Gambar 2.1 Struktur Focused Web Crawling (Bhatt et al., 2015)

a. Seed Url

Proses Focused Web Crawling dimulai dengan me-list daftar url yang akan dikunjungi, yang disebut dengan seed urls (bibit url). Seed url pada sistem ini adalah website lowongan pekerjaan indonesia yaitu loker.id, urbanhire.id dan lokerindonesia.com.

include("seed 1");

include("seed 2");

include("seed 3");

b. Url Queue

Selanjutnya url tersebut masuk ke antrian (url queue). Url akan dihapus jika proses crawling selesai. Proses ini berlanjut hingga url queue kosong.

c. Download

Lalu crawler akan mengunjungi url yang ada di didaftar dan mengidentifikasi semua url dihalaman web. Kemudian url tersebut diambil/didownload oleh web page downloader.

d. Page Parsing

Kemudian yang tersimpan selanjutnya mengalami proses penguraian (parsing).

e. Extract

Kemudian links diextract untuk selanjutnya dilakukan proses topic filtering.

f. Topic Filtering

Selanjutnya adalah topic filtering. Filtering dilakukan untuk mendapatkan relevansi suatu halaman agar hasil terfokus. Berbeda dengan web crawling biasa, proses focused web crawling hanya menelusuri link yang mengarah pada page target dan menghindari link yang tidak mengarah pada page target (Maimunah & Kuspriyanto, 2008). Pada focused web crawling target didefenisikan sehingga crawler tidak mencari seluruh web secara mendalam yang tidak diperlukan dan konten yang didapat disimpan secara dinamis untuk ditampilkan.

Universitas Sumatera Utara

(22)

Proses mendapati konten target yaitu berdasarkan keberadaan link-link code html pada masing-masing website yang disebut dengan title tags links, yang dimaksudkan kemana link yang ada pada halaman web terkolerasi dan kata yang digunakan untuk mendeskripsikan linked-to-page. Hal tersebut akan menghasilkan informasi yang hanya mengarah pada page target dan terhindar dari link yang tidak mengarah pada page target. Hasil informasi yang didapatkan nantinya adalah hasil focused crawling berdasarkan informasi lowongan pekerjaan yang tersedia pada website yang berada pada seed, yaitu loker.id, urbanhire.id dan lokerindonesia.com. Selanjutnya dilakukan proses string matching untuk mendapatkan informasi yang sesuai dengan query user yaitu berdasarkan kecocokan keywords lowongan pekerjaan yang diinput oleh user. Bila hasilnya relevance dengan inputan user maka proses akan mengulang kembali ke antrian (url queue) untuk mendapatkan hasil relevance lainnya.

Jika tidak, maka proses tidak dilanjutkan (stop).

2.5.Algoritma Insertion Sort

Insertion sort adalah sebuah algoritma pengurutan yang membandingkan dua elemen data pertama, mengurutkannya, kemudian mengecek elemen data berikutnya satu persatu dan membandingkannya dengan elemen data yang telah diurutkan. Penggunaan Algoritma Insertion Sort pada penelitian ini adalah untuk mengurutkan hasil posisi pekerjaan yang didapat setelah proses crawling dilakukan.

Insertion Sort Algorithm // Sort an arr[] of size n insertionSort(arr, n) Loop from i = 1 to n-1.

……a) Pick element arr[i] and insert it into sorted sequence arr[0…i-1]

Proses pengurutan dengan menggunakan algoritma Insertion Sort dilakukan dengan cara membandingkan data ke-i (dimana i dimulai dari data ke-2 sampai dengan data terakhir) dengan data berikutnya. Jika ditemukan data yang lebih kecil maka data tersebut disisipkan ke depan sesuai dengan posisi yang seharusnya.

Universitas Sumatera Utara

(23)

9

Contoh insertion sort :

Gambar 2.2 Contoh Algoritma Insertion Sort

;4, 3, 2, 10, 12, 1, 5, 6 Loop from i = 1 to n-1.

i = 1. karena angka 3 lebih kecil dari 4, maka angka 3 dipindahkan ke sebelum 4. Yaitu : 3, 4, 2, 10, 12, 1, 5, 6

i = 2. angka 2 akan berpindah ke paling kiri karena angka 2 lebih kecil dari angka sebelumnya/kiri nya, yaitu 3 dan 4. Yaitu : 2, 3, 4, 10, 12, 1, 5, 6

i = 3. angka 10 tetap pada posisi nya karena angka-angka sebelumnya/kirinya lebih kecil dari dirinya.Yaitu : 2, 3, 4, 10, 12, 1, 5, 6

i = 4. angka 12 tetap pada posisi nya karena angka-angka sebelumnya/kirinya lebih kecil dari dirinya.Yaitu : 2, 3, 4, 10, 12, 1, 5, 6

i = 5. angka 1 akan berpindah ke paling kiri karena angka 1 adalah angka paling kecil dari keseluruhan angka diatas.Yaitu : 1, 2, 3, 4, 10, 12, 5, 6

i = 6. angka 5 akan berpindah ke angka setelah 4.Yaitu : 1, 2, 3, 4, 5, 10, 12, 6 i = 7. angka 6 akan berpindah ke angka setelah 5. Yaitu : 1, 2, 3, 4, 5, 6, 10, 12

Universitas Sumatera Utara

(24)

2.6. Penelitian Terdahulu

Berikut ini beberapa penelitian yang berkaitan dengan algoritma focused crawling :

1. Penelitian yang telah dilakukan oleh Maimunah & Kuspriyanto pada tahun 2008, yaitu berjudul “reinforcement learning dalam proses pembelajaran penentuan strategi penelusuran pada focused crawler”. Penelitian ini mengeksploitasi berbagai strategi dan knowledge base yang ada untuk dapat mengoptimalkan proses penelusuran dan memiliki kemampuan yang lebih bagus dalam mengeksplorasi jalur-jalur menuju page yang relevan.

2. Penelitian yang telah dilakukan oleh Rashmi Janbandhu, Prashant Dahiwale dan M.M.Raghuwanshi pada tahun 2014, yang berjudul “Analysis of Web Crawling Algorithms”. Penelitian ini menunjukkan bahwa focused crawling algorithm mempunyai kelebihan daripada algoritma yang lainnya, dimana algoritma ini mempunyai response time yang paling kecil daripada yang lain.

3. Penelitian yang telah dilakukan oleh Chakrabarti, et al pada tahun 1999 berjudul “1999.

Focused Crawling: A New Approach to Topic-Specific Web Resource Discovery. Computer Networks “, yaitu focused crawling algoritma akan mencari kesamaan dari halaman yang sedang dicrawl dengan query yang diberikan sehingga proses pencarian terfokus dan menghasilkan url yang lebih relevan.

4. Penelitian yang dilakukan oleh Aad et al., 2016. Berjudul “Penerapan Focused Crawling Pada Situs Berita Online “, yaitu penerapan focused web crawling digunakan agar proses penelusuran terfokus karena focused web crawling hanya menelusuri link yang terkait berita sasaran.

5. Penelitian yang dilakukan oleh Bhatt et al., 2015 berjudul “Focused Web Crawler”, yaitu focused web crawling hanya mengambil url yang berhubungan dengan topik sasaran dan menambahkannya ke url queue.

Universitas Sumatera Utara

(25)

11 BAB 3

ANALISIS DAN PERANCANGAN SISTEM

Bab ini menjelaskan tentang analisis dan perancangan sistem yang dilakukan, yaitu merupakan analisis perangkat lunak, analisis program dan model yang akan dibuat. Perancangan sistem dilakukan untuk mendapatkan gambaran jelas mengenai apa yang harus dikerjakan.

3.1. Analisis Sistem

Analisis sistem merupakan bagian yang berfungsi untuk menguraikan seluruh rancangan sistem yang berkaitan dengan penelitian penulis. Analisisnya berupa analisis permasalahan dalam sistem penelitian, analisis proses, model sistem yang akan digunakan, pseudocode dari program yang telah buat, flowchart sistem serta desain antarmuka yang akan dibuat pada sistem penelitian ini. Dengan adanya analisis ini, maka tahapan yang akan dilakukan menjadi jelas dan mudah dipahami untuk membuat implementasi dari sistem yang sudah ada.

3.2. Analisis Masalah

Dari latar belakang yang sudah dijelaskan pada bab sebelumnya bahwa permasalahan yang akan dibahas pada penelitian ini adalah tentang sulitnya user/seseorang untuk menemukan situs lowongan pekerjaan yang akurat serta efisien sesuai dengan yang dicari. Sering kali ketika user mencari informasi lowongan pekerjaan di internet umumnya harus mensortir kembali satu-satu informasi mana yang benar-benar tepat dia cari dan butuhkan, dimana hal tersebut sangat membuang waktu.

Universitas Sumatera Utara

(26)

Gambar 3.1. merupakan gambaran umum dari permasalahan penelitian yang dijelaskan pada Ishikawa diagram (fishbone) :

Gambar 3.1 Diagram Analisis Masalah

Pada gambar 3.1 dijelaskan aspek-aspek atau masalah terkait sebuah sistem penelitian, yaitu aspek mesin, aspek manusia, aspek material dan aspek metode.

Pada Aspek mesin membahas tentang hasil pencarian tidak memberikan informasi yang tepat sesuai yg input user. Aspek user membahas dimana user harus mensortir kembali hasil informasi yang dia dapatkan satu persatu. Aspek material membahas tentang permasalahan dimana beragamnya jenis informasi lowongan pekerjaan yang tersedia, dan informasi tidak akurat serta efisien sesuai inputan user. Aspek metode membahas permasalahan yang terjadi yaitu hasil penelusuran tidak selalu relevan dengan yang dicari, misal user menginputkan query untuk mencari informasi lowongan pekerjaan “guru di medan”, maka penelusuran pada umumnya bisa menampilkan informasi mengenai lowongan pekerjaan admin di medan. Yang informasi tersebut tidak sesuai dengan yang user cari dan butuhkan.

3.3. Analisis Kebutuhan

Analisis masalah pada dasarnya memiliki dua bagian, yaitu analisis kebutuhan fungsional dan analisis nonfungsional. Analisis fungsional membahas tentang fitur (aktivitas) yang harus ada pada suatu sistem penelitian. Sedangkan analisis nonfungsional bertugas untuk membahas terkait fitur (aktivitas) lainnya pada sistem penelitian ini.

Universitas Sumatera Utara

(27)

13

3.3.1. Analisis Kebutuhan Fungsional

Analisis kebutuhan fungsional yang terdapat pada sistem penelitian ini adalah yaitu sistem menerima inputan dari user yaitu kata pencarian dan lokasi.

3.3.2.Analisis Kebutuhan Nonfungsional

Analisis kebutuhan nonfungsional yang terdapat pada sistem penelitian ini adalah:

a. Performa

Sistem focused web crawling dibuat dengan algoritma focused web crawling dan algoritma Insertion sort sehingga yang akan menghasilkan crawling/hasil penelusuran yang terfokus dan efisien.

b. Kontrol

Sistem focused web crawling pada penelitian ini dibuat dengan menampilkan hasil penelusuran berdasarkan query inputan user.

c. Manajemen Kualitas

Pada sistem focused web crawling ini user mendapatkan infromasi lebih dari 1 website lowongan pekerjaan tanpa harus membaca satu per satu dan memilah kembali hasil informasi yang tidak sesuai dengan yang dicarinya dari website- website lowongan pekerjaan diinternet.

d. Pelayanan

Sistem focused web crawling ini dibuat dengan kondisi user friendly, artinya pengguna dapat mengerti bagaimana cara menjalankan sistem penelitian yang telah dibuat.

3.4. Permodelan Sistem

Permodelan sistem dibuat bertujuan untuk dapat memberikan informasi dalam beberapa model terkait dengan ruang lingkup penelitian dalam bentuk interaksi sistem penelitian. Beberapa jenis permodelan sistem yang digunakan dalam pada berbagai sistem penelitian adalah use case diagram, activity diagram serta sequence diagram

Universitas Sumatera Utara

(28)

3.4.1. Diagram Umum Sistem

Gambar 3.2 Diagram Umum Sistem Keterangan Gambar 3.2 :

Sistem terdiri dari 3 bagian penting yaitu bagian input, bagian focused web crawling dan bagian insertion sort (pengurutan) sebagai berikut :

Input Keyword a. Kata Pencarian

User memasukan keywords berupa kata pencarian.

b. Lokasi

User memasukan keywords berupa lokasi. Setelah input maka berlanjut ke proses focused web crawling.

Focused Web Crawling a. Seed Url

Proses Focused Web Crawling dimulai dengan me-list daftar url yang akan

dikunjungi, yang disebut dengan seed urls (bibit url). Seed url pada sistem ini adalah website lowongan pekerjaan indonesia yaitu loker.id, urbanhire.id dan

lokerindonesia.com.

b. Url Queue

Selanjutnya url tersebut masuk ke antrian (url queue).

c. Download

Lalu crawler akan mengunjungi url yang ada di didaftar dan mengidentifikasi semua url dihalaman web. Kemudian url tersebut diambil/didownload.

Universitas Sumatera Utara

(29)

15

d. Page Parsing

Kemudian yang tersimpan selanjutnya mengalami proses penguraian (parsing).

e. Extract

Setelah itu url di extract kemudian di masuk ke proses topic filtering.

f. Topic Filtering

Setelah diextract, selanjutnya adalah topic filtering yaitu bila hasilnya relevance dengan inputan user maka proses akan mengulang kembali ke antrian (url queue) untuk mendapatkan hasil relevance lainnya. Jika tidak, maka proses tidak dilanjutkan (stop).

Insertion Sort

Setelah dari proses focused web crawling, hasil yang didapat akan diurutkan dengan insertion sort, dimana parameter penentuan suatu url-nya lebih tinggi rangking pengurutannya dibanding yang lain adalah berdasarkan alfabet pada judul kata pencarian atau judul posisi pekerjaan. Saat hasil dari proses focused web crawling didapatkan, maka judul posisi pekerjaan dengan alfabet tertinggi (A-Z) akan muncul paling atas dan seterusnya berurutan sesuai alfabet.

3.4.2. Use Case Diagram

Use case merupakan suatu gambaran fungsionalitas dari suatu sistem, sehingga user atau pengguna sistem bisa memahami mengenai kegunaan sistem yang akan dibangun. Pada penelitian ini use case diagram digambarkan pada gambar 3.3 :

Gambar 3.3 Use Case Diagram fungsional system Pada gambar 3.3 menunjukkan interaksi antara pengguna sistem (user) dalam menjalankan sebuah sistem yang telah dibangun pada penelitian ini.

Universitas Sumatera Utara

(30)

Untuk uraian yang lebih lengkap dari use case diagram akan dijelaskan pada tabel 3.1:

Tabel 3.1 Narasi input (kata pencarian dan lokasi)

Use case diagram meng-input keywords (kata pencarian dan lokasi) bertujuan untuk mendapatkan hasil penelusuran. Setelah user meng-input keywords, selanjutnya akan mendapatkan hasil penelusuran.

Nama Use Case Input Kata pencarian dan lokasi

Aktor User

Dekripsi

User menginputkan query kata pencarian dan lokasi untuk ditelusuri

Pre-Condition User masuk kedalam sistem yang telah dibuat, yaitu halaman utama

Typical course of event Aktivias User Respon Sistem User meng-input

query kata

pencariandan lokasi

1. Sistem menampilkan halaman awal untuk memulai.

2. Sistem memberikan respon, yaitu menampilkan hasil penelusuran sesuai dengan inputan user.

Post Condition Tampil hasil pencarian

Universitas Sumatera Utara

(31)

17 3.4.3. Activity Diagram

Activity diagram adalah diagram yang menggambarkan aktivitas dalam sebuah sistem yang sedang berjalan. Activity diagram dari sistem yang akan dibangun dapat ditunjukkan pada Gambar 3.4 sebagai berikut :

Gambar 3.4 Activity Diagram Fungsional Sistem

Didalam Activity diagram dapat dijelaskan bahwa pengguna masuk ke halaman utama, lalu harus menginputkan keywords yaitu kata pencarian dan lokasi terlebih dahulu. Kemudian pada system, proses focused web crawling terjadi, selanjutnya hasil dari proses crawling akan disorting dengan algoritma insertion sort. Setelah itu hasil informasi lowongan pekerjaan akan tampil beserta link website-nya dan untuk melihat informasi lebih lanjut mengenai loker tersebut, pengguna dapat memilih link dan informasi lowongan pekerjaan akan tampil.

Universitas Sumatera Utara

(32)

3.4.4. Sequence Diagram

Sequence diagram mengilustrasikan bagaimana pesan dikirim dan diterima diantara objek, dan berada diurutan yang mana. Selain itu, sequence diagram membantu untuk menggambarkan data yang masuk dan keluar dari sebuah sistem penelitian. Gambar 3.4 akan mengilustrasikan sequence diagram dari sistem penelitian ini :

Gambar 3.5 Sequence Diagram Perancangan Analisis Sistem

Pada Gambar 3.5 yang dilakukan user adalah menginputkan keywords terlebih dahulu pada halaman awal. Setelah user input keywords dan klik button cari, maka proses focused web crawling terjadi. Setelah itu hasil crawling akan disorting dengan alogoritma insertion sort, Kemudian menampilkan respon kepada user.

Universitas Sumatera Utara

(33)

19

3.4.5 Flowchart Sistem

Pada tahap ini, akan digambarkan bagaimana proses algoritma penelitian. Proses lengkapnya dapat dilihat pada alur flowchart berikut ini :

Gambar 3.6 Flowchart Perancangan Sistem Penelitian Keterangan Gambar 3.6 :

Flowchart diatas menunjukkan gambaran dari proses penelitian antara lain : 1.Pada halaman Lowongan, user menginputkan kata pencarian dan lokasi

untuk mencari informasi perkerjaan.

2. Selanjutnya data akan diambil melalui proses focused web crawling.

3. Kemudian hasil crawling yang didapat akan diurutkan dengan algoritma insertion sort.

4. Lalu hasil ditampilkan.

5. Kemudian proses selesai.

Universitas Sumatera Utara

(34)

3.5. Perancangan Sistem

3.5.1. Rancangan Halaman Utama

Pada saat membuka aplikasi sistem, tampilan pertama kali adalah halaman utama website.

Gambar 3.7 Rancangan Tampilan Awal Sistem

Keterangan Gambar 3.7 : 1. Judul Website.

2. Menu “cari” berisi halaman beranda mengenai info lowongan pekerjaan yang tersedia dan user dapat menginputkan keywords untuk mencari info lowongan pekerjaan.

3. Tempat user menginputkan “kata pencarian” berupa posisi pekerjaan untuk mecari info loker.

4. Tempat user menginputkan “lokasi” untuk mencari info loker.

5. Button “cari”.

6. Tampilan informasi loker.

7. Footer website.

Halaman utama adalah halaman dimana user menginputkan querynya untuk mendapatkan informasi lowongan pekerjaan, selain itu user juga dapat melihat lowongan pekerjaan yang tersedia pada halaman utama ini.

Universitas Sumatera Utara

(35)

21

3.5.2. Rancangan Halaman Hasil Pencarian

Halaman hasil pencarian adalah halaman dimana hasil informasi lowongan pekerjaan yang telah dicari oleh user dengan menginputkan query yaitu posisi pekerjaan dan lokasi pekerjaan ditampilkan.

Gambar 3.8 Rancangan Tampilan Halaman Hasil Pencarian

Keterangan Gambar 3.8 : 1. Logo Perusahaan 2. Nama Perusahaan 3. Lokasi Pekerjaan 4. Posisi Pekerjaan

5. Deskripsi singkat mengenai pekerjaan.

6. Button lihat selengkapnya.

Universitas Sumatera Utara

(36)

BAB 4

IMPLEMENTASI DAN PENGUJIAN

4.1 Implementasi Sistem

Implementasi Sistem merupakan tampilkan hasil berdasarkan perancangan dari Bab 3, yaitu bentuk jadi dari semua rencana terkait rancangan sistem aplikasi yang akan dibangun pada sistem penelitian ini, Pada tahapan ini, sistem aplikasi yang sudah direncanakan diawal akan dibangun dengan memiliki kesesuaian dengan rancangan sistem aplikasi yang telah dibahas pada bab sebelumnya.

Pada bab ini akan membahas mengenai hasil informasi lowongan pekerjaan indonesia berbasis website yang didapat dengan mengunakan implementasi focused web crawling algorithm, yang kemudian hasil dari proses crawling yang diperoleh diurutkan dengan algoritma insertion sort, sesuai dengan analisis dan perancangan yang telah dibahas pada Bab 3.

Aplikasi yang dibangun pada sistem penelitian ini berbasis website yang dapat diakses dari desktop maupun di platform mobile lainnya. Web hosting pada penelitian ini memakai web hosting dari dewabiz, dengan nama domain yaitu lowonganku.xyz. Dan bahasa pemrograman pada sistem penelitian ini adalah PHP (Hypertext Preprocessor) menggunakan Aplikasi Notepad++ dan Xampp. urls seed pada penelitian ini adalah loker.id, urbanhire.id, dan lokerindonesia.com.

4.2 Proses Implementasi Sistem

Berdasarkan perancangan pada bab 3, proses implementasi sistem adalah sebagai berikut : 1. Proses User Input

Proses dimulai dengan user menginput keyword pada kolom pencarian, yaitu berupa judul posisi pekerjaan atau disebut sebagai kata pencarian, dan lokasi.

Gambar 4.1 Tampilan Proses User Input

Universitas Sumatera Utara

(37)

23

2. Proses Focused Web Crawling

Selanjutnya proses focused web crawling dilakukan, prosesnya terdiri dari beberapa tahap yaitu sebagai berikut :

a. Seed Url

Proses Focused Web Crawling dimulai dengan me-list daftar url yang akan dikunjungi, yang disebut dengan seed urls (bibit url). Seed url pada sistem ini adalah website lowongan pekerjaan indonesia yaitu loker.id, urbanhire.id dan lokerindonesia.com.

include("lokerid.php");

include("urbanhirecom.php");

include("lokerindonesiacom.php");

lalu masing-masing seed diinisialisasi pada masing-masing website untuk mendapatkan konten target yang dibutuhkan.

b. Url Queue

Selanjutnya url tersebut masuk ke antrian (url queue). Url akan dihapus jika proses crawling selesai. Proses ini berlanjut hingga url queue kosong.

c. Download

Lalu crawler akan mengunjungi url yang ada di didaftar dan mengidentifikasi semua url dihalaman web. Kemudian url tersebut diambil/didownload oleh web page downloader.

d. Page Parsing

Kemudian yang tersimpan selanjutnya mengalami proses penguraian (parsing).

e. Extract

Kemudian links diextract untuk selanjutnya dilakukan proses topic filtering.

f. Topic Filtering

Selanjutnya adalah topic filtering. Filtering dilakukan untuk mendapatkan relevansi suatu halaman agar hasil terfokus. Berbeda dengan web crawling biasa, proses focused web crawling hanya menelusuri link yang mengarah pada page target dan menghindari link yang tidak mengarah pada page target (Maimunah & Kuspriyanto, 2008). Pada focused web crawling target didefenisikan sehingga crawler tidak mencari seluruh web secara mendalam yang tidak diperlukan dan konten yang didapat disimpan secara dinamis untuk ditampilkan. Konten target pada penelitian ini adalah sebagai berikut :

Universitas Sumatera Utara

(38)

1. Logo perusahaan 2. Nama perusahaan 3. Lokasi

4. Judul posisi pekerjaan

5. Keterangan lowongan pekerjaan yang dibatasi sebanyak tidak lebih dari 100 huruf.

6. Link “lihat selengkapnya” untuk melihat keterangan selengkapnya mengenai informasi lowongan.

Gambar 4.2 Tampilan Konten Target Sistem

Proses mendapati konten target yaitu berdasarkan keberadaan link-link code html pada masing-masing website yang disebut dengan title tags links, yang dimaksudkan kemana link yang ada pada halaman web terkolerasi dan kata yang digunakan untuk mendeskripsikan linked-to-page. Hal tersebut akan menghasilkan informasi yang hanya mengarah pada page target dan terhindar dari link yang tidak mengarah pada page target. Hasil informasi yang didapatkan nantinya adalah hasil focused crawling berdasarkan informasi lowongan pekerjaan yang tersedia pada website yang berada pada seed, yaitu loker.id, urbanhire.id dan lokerindonesia.com. Selanjutnya dilakukan proses string matching untuk mendapatkan informasi yang sesuai dengan query user yaitu berdasarkan kecocokan keywords lowongan pekerjaan yang diinput oleh user. Bila hasilnya relevance dengan inputan user maka proses akan mengulang kembali ke antrian (url queue) untuk mendapatkan hasil relevance lainnya.

Jika tidak, maka proses tidak dilanjutkan (stop).

3. Proses Insertion Sort

Insertion sort pada penelitian ini berguna untuk mengurutkan hasil informasi yang telah didapatkan dari proses focused web crawling. Insertion sort akan melakukan penyortiran pada hasil crawling yang telah didapat berdasarkan judul posisi pekerjaan yaitu berdasarkan alfabet. Saat hasil dari proses focused web crawling didapatkan, maka judul posisi pekerjaan dengan alfabet tertinggi (A-Z) akan muncul paling atas dan seterusnya berurutan sesuai alfabet, hal tersebut akan mempermudah user dalam proses pencarian informasi lowongan pekerjaan.

Universitas Sumatera Utara

(39)

25

4.3. Implementasi Antarmuka 4.3.1. Halaman Utama

Halaman utama merupakan halaman awal website. Di halaman ini user dapat meng-input keyword untuk mencari informasi lowongan pekerjaan serta mendapatkan informasi lowongan pekerjaan. Seperti pada gambar dibawah ini :

Gambar 4.4 Halaman Utama Sistem Penelitian (mobile phone version) Gambar 4.3 Halaman Utama Sistem Penelitian (desktop version)

Universitas Sumatera Utara

(40)

4.3.2. Tampilan User Input Keyword

User harus menginput keywords berupa kata pencarian yaitu posisi pekerjaan yang ingin dicari dan lokasi. Berikut contoh tampilan ketika user ingin mencari informasi lowongan pekerjaan programmer yang berlokasi di kota jakarta.

Input kata pencarian : “Programmer”

Input lokasi : “Jakarta”

Gambar 4.5 Tampilan user input keywords (desktop version)

Gambar 4.6 Tampilan user input keywords (mobile phone version)

Universitas Sumatera Utara

(41)

27

4.4. Pengujian Sistem

Untuk menguji penelitian ini, penulis membuat 11 contoh kasus berbeda berdasarkan loker per- tanggal 17 Oktober 2019, yaitu sebagai berikut :

4.4.1. Pengujian 1

Kasus 1 : seorang user ingin mencari informasi lowongan pekerjaan programmer yang berlokasi di kota jakarta. Hasil pengujian informasinya sebagai berikut :

1. User menginput keywords (kata pencarian dan lokasi).

Input kata pencarian : “PROGRAMMER”

Input lokasi : “JAKARTA”

Gambar 4.7 Tampilan Halaman Pencarian (user input keywords) 2. Hasil informasi lowongan pekerjaan yang tampil (hasil crawling dan insertion sort)

Gambar 4.8 Tampilan Hasil Informasi Lowongan Kerja (1)

Universitas Sumatera Utara

(42)

Gambar 4.9 Tampilan Hasil Informasi Lowongan Kerja (2)

Gambar 4.10 Tampilan Hasil Informasi Lowongan Kerja (3)

Gambar 4.11 Tampilan Hasil Informasi Lowongan Kerja (4)

Universitas Sumatera Utara

(43)

29

Gambar 4.12 Tampilan Hasil Informasi Lowongan Kerja (5) Hasil :

Tabel 4.1 Hasil Informasi Lowongan Pekerjaan Pengujian 1

No. Instansi/Perusahaan Posisi Lokasi

1 Global Service Indonesia .NET Programmer global service indonesia

Jakarta Timur

2 Kota business softwares Front & back end programmer Jakarta Selatan

3 PT. Infomedia nusantara IT Programmer Jakarta

4 Intrias Mandiri Sejati IT Programmer Jakarta Barat

5 PT.BSC Indonesia Jr.SoftwareDeveloper/Programmer Magang

DKI Jakarta

6 PT Adicipta inovasi teknologi Junior Programmer Jakarta Barat

7 Blazz Pratama Indonesia Junior Programmer Jakarta Pusat

8 PT. Executrain Nusantara Jaya Programmer Jakarta Selatan

9 Mitra Digital Futuristik Programmer Jakarta Pusat

10 Dataprima Sejahtera Programmer Jakarta Barat

11 Tex Creatives Programmer - Freelance project Jakarta Utara

12 Adhyamitra Programmer Aplikasi Adhyamitra DKI Jakarta

13 PT. Valsix Kreasi Teknologi Programmer PT. Valsix Jakarta Barat 14 PT. Cipta Putra Manunggal Programmer PT. Cipta Putra Jakarta Selatan

15 PT. AMG React Native Programmer Jakarta Selatan

16 Passion Jewerely Senior Programmer Jakarta

Universitas Sumatera Utara

(44)

17 PT. Era iber teknologi Staff Programmer PT. Era iber DKI Jakarta

18 Narrada Communications Web Programmer Jakarta Selatan

19 PT. Anantara digital indonesia Web Programmer PT. Anantara Jakarta Selatan 20 PT. Indo Guna Sejahtera Web Programmer PT.Indo Guna DKI Jakarta

a. Jumlah loker yang didapat : 20 hasil

b. Relevansi : Didapatkan hasil relevansi 100% (parameternya adalah kesesuaian query yang diinputkan dan hasil yang dapatkan).

4.4.2. Pengujian 2

Kasus 2 : seorang user ingin mencari informasi lowongan pekerjaan guru matematika yang berlokasi di jawa barat. Hasil pengujian informasinya sebagai berikut :

1. User menginput keywords (kata pencarian dan lokasi).

Input kata pencarian : “GURU MATEMATIKA”

Input lokasi : “JAWA BARAT”

Gambar 4.13 Tampilan Halaman Pencarian (user input keywords)

Universitas Sumatera Utara

(45)

31 2. Hasil informasi lowongan pekerjaan yang tampil (hasil crawling dan insertion sort)

Gambar 4.14 Tampilan Hasil Informasi Lowongan Kerja (1)

Gambar 4.15 Tampilan Hasil Informasi Lowongan Kerja (2) Hasil :

Tabel 4.2 Hasil Informasi Lowongan Pekerjaan Pengujian 2

No. Instansi/Perusahaan Posisi Lokasi

1 Ispeak Languange Center Guru Matematika & Ilmu Pengetahuan Alam

Bandung Kota, Jawa Barat

2 Sakamoto Pondok Nurul Fikri Guru Matematika Depok,

Jawa Barat

Universitas Sumatera Utara

(46)

3 Matematika Sakamoto Guru Matematika Sakamoto Bogor Bogor, Jawa Barat 4 Cibinong Learning Center Guru Matematika Shinkenjuku

Cibinong

Bogor, Jawa Barat 5 PT.Bina Unggul Sejahtera Guru Matamatika SMA Sinotif Depok,

Jawa Barat

6 General Education Center Guru Matematika Bandung Kota,

Jawa Barat

7 LPIA, Gama UI Kranggan Guru Matematika Bekasi,

Jawa Barat

a. Jumlah loker yang didapat : 7 hasil.

b. Relevansi : Didapatkan hasil relevansi 100% (parameternya adalah kesesuaian query yang diinputkan dan hasil yang dapatkan).

4.4.3 Pengujian 3

Kasus 3 : seorang user ingin mencari informasi lowongan pekerjaan sales yang berlokasi di Medan.

Hasil pengujian informasinya sebagai berikut :

1. User menginput keywords (kata pencarian dan lokasi).

Input kata pencarian : “SALES”

Input Lokasi : “MEDAN”

Gambar 4.16 Tampilan Halaman Pencarian (user input keywords)

Universitas Sumatera Utara

(47)

2. Hasil informasi lowongan pekerjaan yang tampil (hasil crawling dan insertion sort)

Gambar 4.17 Tampilan Hasil Informasi Lowongan Kerja (1)

Gambar 4.18 Tampilan Hasil Informasi Lowongan Kerja (2)

Gambar 4.19 Tampilan Hasil Informasi Lowongan Kerja (3)

Universitas Sumatera Utara

(48)

Hasil :

Tabel 4.3 Hasil Informasi Lowongan Pekerjaan Pengujian 3

No. Instansi/Perusahaan Posisi Lokasi

1 PT.Sinartech Multi Perkasa Admin Sales PT. Sinartech Medan 2 Idol Teknologi Indonesia Sales Marketing bidang aksesoris

ponsel

Medan

3 Passion Jewerely Consultant Sales Medan, dll

4 PT.Sinartech Multi Perkasa Sales Engineer Medan

5 Jetstar Airways Sales Executive Medan

6 PT.Katalis Datesa Prima Sales Marketing Medan

7 PT.World Innovative

Telecommunication

Sales Marketing Medan

8 PT.Sinartech Multi Perkasa Sales Project Medan

9 PT.Aditya Sarana Graha Sales Supervisor Medan, dll

10 PT. Mikrotek Komputerindo Sales Support Medan

a. Jumlah loker yang didapat : 10 hasil

b. Relevansi : Didapatkan hasil relevansi 100% (parameternya adalah kesesuaian query yang diinputkan dan hasil yang dapatkan).

4.4.4. Pengujian 4

Kasus 4 : seorang user ingin mencari informasi lowongan pekerjaan manager yang berlokasi di Denpasar. Hasil pengujian informasinya sebagai berikut :

User menginput keywords (kata pencarian dan lokasi) Input kata pencarian : “MANAGER”

Input Lokasi : “DENPASAR”

Gambar 4.20 Tampilan Halaman Pencarian (user input keywords)

Universitas Sumatera Utara

(49)

35

1. Hasil informasi lowongan pekerjaan yang tampil (hasil crawling dan insertion sort)

Gambar 4.21 Tampilan Hasil Informasi Lowongan Kerja (1)

Gambar 4.22 Tampilan Hasil Informasi Lowongan Kerja (2)

Gambar 4.23 Tampilan Hasil Informasi Lowongan Kerja (3)

Universitas Sumatera Utara

(50)

Hasil :

Tabel 4.4 Hasil Informasi Lowongan Pekerjaan Pengujian 4

No. Instansi/Perusahaan Posisi Lokasi

1 Grab Indonesia Account Manager Denpasar

2 Level 21 Mall Asst.Marketing Communication

Manager

Denpasar

3 Ruang Raya Indonesia Branch Manager Denpasar

4 Helpster Customer Success Manager Denpasar

5 Home Credit Indonesia District Manager Sales Denpasar

6 PT.Bali Smartcard Solusindo Manager Produksi Percetetakan Denpasar 7 Orange Biz Solution Office Manager Orange Biz Solution Denpasar 8 Bali Pro Employment Ageny

Division

Production Planning Manager- Pesanggaran Bali

Denpasar

9 PT.Lunadorii Utama Indonesia Regional Manager/Store Manager Denpasar 10 Diamond Handphone Relationship Manager Diamond

Handphone Denpasar

Denpasar

a. Jumlah loker yang didapat : 10 hasil

b. Relevansi : Didapatkan hasil relevansi 100% (parameternya adalah kesesuaian query yang diinputkan dan hasil yang dapatkan).

4.4.5. Pengujian 5

1. User menginput keywords (kata pencarian dan lokasi) User input kata pencarian : “MANAGER”

User input lokasi : “JAKARTA”

Gambar 4.24 Tampilan Halaman Pencarian (user input keywords)

Universitas Sumatera Utara

(51)

37

2.Hasil informasi lowongan pekerjaan yang tampil (hasil crawling dan insertion sort)

Gambar 4.25 Tampilan Hasil Informasi Lowongan Kerja (1)

Gambar 4.26 Tampilan Hasil Informasi Lowongan Kerja (2)

Gambar 4.27 Tampilan Hasil Informasi Lowongan Kerja (3)

Universitas Sumatera Utara

(52)

Gambar 4.28 Tampilan Hasil Informasi Lowongan Kerja (4)

Gambar 4.29 Tampilan Hasil Informasi Lowongan Kerja (5)

Gambar 4.30 Tampilan Hasil Informasi Lowongan Kerja (6) Hasil : 21 Informasi

Universitas Sumatera Utara

(53)

39

4.5. Pengujian yang tidak diakomodir sistem

Sistem ini memiliki batasan masalah apabila user meng-input query yang salah penulisannya, maka hasil pencarian tidak akan muncul. Yaitu sebagai berikut :

4.5.1. Pengujian 1

1. User menginput keywords (kata pencarian dan lokasi) User input kata pencarian : “MANAZER”

User input lokasi : “JAKARTA”

Gambar 4.31 Tampilan Halaman Pencarian (user input keywords)

2.Hasil informasi lowongan pekerjaan yang tampil (hasil crawling dan insertion sort)

Gambar 4.32 Tampilan Hasil Informasi Lowongan Kerja Hasil : 0 Informasi

Universitas Sumatera Utara

(54)

4.5.2. Pengujian 2

1. User menginput keywords (kata pencarian dan lokasi) User input kata pencarian : “GURUU”

User input lokasi : “MEDAN”

Gambar 4.33 Tampilan Halaman Pencarian (user input keywords)

2.Hasil informasi lowongan pekerjaan yang tampil (hasil crawling dan insertion sort)

Gambar 4.34 Tampilan Hasil Informasi Lowongan Kerja

Hasil : 0 Informasi 4.5.3. Pengujian 3

1. User menginput keywords (kata pencarian dan lokasi) User input kata pencarian : “DOKTER WEB”

User input lokasi : “JAKARTA”

Universitas Sumatera Utara

(55)

41

Gambar 4.35 Tampilan Halaman Pencarian (user input keywords) 2.Hasil informasi lowongan pekerjaan yang tampil (hasil crawling dan insertion sort)

Gambar 4.36 Tampilan Hasil Informasi Lowongan Kerja

Hasil : 0 Informasi

Universitas Sumatera Utara

(56)

4.5.4 Pengujian 4

1. User menginput keywords (kata pencarian dan lokasi) User input kata pencarian : “GURU WEBSITE”

User input lokasi : “INDONESIA”

Gambar 4.37 Tampilan Halaman Pencarian (user input keywords) 2.Hasil informasi lowongan pekerjaan yang tampil (hasil crawling dan insertion sort)

Gambar 4.38 Tampilan Hasil Informasi Lowongan Kerja

Hasil : 0 Informasi

Universitas Sumatera Utara

(57)

43

4.5.5 Pengujian 5

1. User menginput keywords (kata pencarian dan lokasi) User input kata pencarian : “DOSEN KILLER”

User input lokasi : “SELURUH INDONESIA”

Gambar 4.39 Tampilan Halaman Pencarian (user input keywords)

2.Hasil informasi lowongan pekerjaan yang tampil (hasil crawling dan insertion sort)

Gambar 4.40 Tampilan Hasil Informasi Lowongan Kerja

Hasil : 0 Informasi

Universitas Sumatera Utara

(58)

4.5.6 Pengujian 6

1. User menginput keywords (kata pencarian dan lokasi) User input kata pencarian : “PROGRAMMER FISIKA”

User input lokasi : “SELURUH INDONESIA”

Gambar 4.41 Tampilan Halaman Pencarian (user input keywords) 2.Hasil informasi lowongan pekerjaan yang tampil (hasil crawling dan insertion sort)

Gambar 4.42 Tampilan Hasil Informasi Lowongan Kerja

Hasil : 0 Informasi

4.6. Analisis hasil evaluasi keywords

Berdasarkan hasil pengujian diatas, hasil informasi pada saat user masukan keywords yang salah penulisannya ataupun kata pencarian yang benar diikuti dengan kata yang salah setelahnya seperti “doker web”, maka hasilnya adalah keyword tidak dapat diakomodir sistem dan hasilnya adalah 0 informasi atau hasil pencarian tidak ada.

Universitas Sumatera Utara

(59)

45

BAB 5

KESIMPULAN DAN SARAN

5.1. Kesimpulan

Berdasarkan hasil studi literatur, analisis, perancangan, implementasi, dan pengujian sistem maka kesimpulan yang didapat adalah sebagai berikut:

1. Algoritma focused web crawling yang diimplementasikan pada situs lowongan pekerjaan indonesia berbasis web menghasilkan informasi yang terfokus dan akurat.

2. Waktu yang dibutuhkan user untuk mendapatkan informasi lowongan pekerjaan efisien karena user tidak perlu memilah kembali setiap informasi yang keluar dari berbagai situs web secara manual.

3. Urutan data hasil crawling diurutkan dengan baik menggunakan algoritma insertion sort yaitu diurutkan berdasarkan alfabet posisi pekerjaan yang keluar.

5.2. Saran

Saran yang dapat penulis berikan untuk pengembangan selanjutnya adalah sebagai berikut:

1. Untuk pengembangan tahap selanjutnya, diharapkan menggunakan seed url lebih banyak, sehingga informasi yang dihasilkan juga lebih banyak.

2. Men-desain lebih dinamis, sehingga website juga terlihat bagus saat dibuka via mobile phone

Universitas Sumatera Utara

(60)

DAFTAR PUSTAKA

Aad, Muzad Miqdad Muadz., Rahutomo, Faisal., Rozi, Imam Fahrur. 2016.

Penerapan Focused Crawling Pada Situs Berita Online. Politeknik Negeri Malang.

Agustian, Achmad Fuad., Adzani, Dina Adzani., Haslan, Siti Fauzia., Wicaksana, I Wayan S. 2012. Analisis Search Matching Pada Search Engine. Bali : Konferensi Nasional Sistem Informasi STMIK – STIKOM.

Allauddin, Maria., Azam, Farooque. 2011. Service Crawling using Google Custom Search API. International Journal of Computer Applications (0975 – 8887) Volume 34– No.7. Pakistan.

Bhatt, Dvijesh., Vyas, Daiwat Amit., Pandya Sharnil. 2015. Focused Web Crawler. Delhi : Institute of Tech, Nirma University.

Chakrabarti, S., Berg, M. v. d. & Dom, B., 1999. Focused Crawling: A New Approach to Topic-Specific Web Resource Discovery. Computer Networks, pp.

1623-1640.

Hidayat, Ade Ofik. 2011. Evaluasi Algoritme Breadth First, Best First, dan Page Rank Pada Web Crawler. Skripsi. Departemen Ilmu Komputer Institut Pertanian Bogor.

Indrajit, Richardus Eko. 2013. Pemanfaatan Search Engine Sebagai Sarana Penunjang Proses Pembelajaran. Jakarta : Penerbit Andi.

Maimunah, Siti., Kuspriyanto. 2008. Reinforcement Learning dalam Proses Pembelajaran Penentuan Strategi Penelusuran pada Focused Crawling. Sekolah Teknik Elektro dan Informatika Institut Teknologi Bandung.

Universitas Sumatera Utara

(61)

Manning, Christopher D., Raghava, Prabhakar., Sch¨utze, Hinrich. 2008.

Introduction to Information Retrieval. New York : Cambridge University Press.

Najwan, Atras. 2016. Focused Web Crawling Dengan Sistem Terdistribusi.

Skripsi. Universitas Sumatera Utara.

Rashmi Janbandhu, Prashant Dahiwale dan M.M.Raghuwanshi. 2014. Analysis of Web Crawling Algorithms. International Journal on Recent and Innovation Trends in Computing and Communication, Vol. 2

Sembiring, Chyntia Arilla. 2014. Focused Crawling Untuk Megomptimalkan pencarian Jurmal Menggunakan Metode Porter Stemmer. Skripsi. Universitas Sumatera Utara.

Yazidanyastuti. 2011. Aplikasi analisis halaman website pada mesin pencari google (google search engine). Skripsi. Universitas Islam Negeri Syarif Hidayatullah Jakarta.

Zain, Al Faruq. 2013. SEO COURSE. Elzain Institude.

47

Universitas Sumatera Utara

Gambar

Gambar  3.1.  merupakan  gambaran  umum  dari  permasalahan  penelitian  yang  dijelaskan pada Ishikawa diagram (fishbone) :
Gambar 3.2 Diagram Umum Sistem  Keterangan Gambar 3.2 :
Gambar 3.4 Activity Diagram Fungsional Sistem
Gambar 3.5 Sequence Diagram Perancangan Analisis Sistem
+7

Referensi

Dokumen terkait

Evaluasi dan pengembangan kurikulum Program Studi Diploma III Teknik Sipil diarahkan untuk menghasilkan lulusan yang mampu mengaplikasikan konsep perencanaan konstruksi

Tujuan Penelitian : Untuk mengetahui, mengkaji dan menganalisis apakah pelaksanaan perubahan penggunaan tanah pertanian menjadi non pertanian untuk pembangunan

Tujuan dari penelitian adalah (1) untuk mengetahui tingkat partisipasi pasangan usia subur (PUS) dalam pelaksanaan program KB di Kecamatan Bergas (2) untuk mengetahui

perikanan adalah kemampuan dalam menelusuri keseluruhan sistem produksi yang dimulai dari persyaratan unit usaha budidaya perikanan, managemen pemeliharaan, managemen

Oleh karena itu disarankan agar Kepala Sekolah selalu memperhatikan dan mengembangkan motivasi berprestasi, Iklim Keluarga dan Disiplin Belajar dalam usaha untuk

This book, the record of his residence, his thoughts, and observations during the time he lived in the woods upon the shore of Walden Pond, in Concord, Massachusetts, is of the

Nilai SEC tersebut juga berhubungan dengan nilai SECV yang merupakan galat metode validasi silang apabila nilai SECV semakin besar maka semakin banyak juga galat

Sebuah bisnis tentunya ingin usahanya tetap maju dan bertahan dalam jangka waktu yang panjang, untuk itu sebagai salah satu restoran yang mempunyai konsep yang baru dan unik,