BAB II LANDASAN TEORI Di dalam landasan teori ini, akan dibahas tentang teori – teori dan konsep dasar yang mendukung pembahasan dari sistem yang akan dibuat. - Sistem Rekomendasi Pencarian Pekerjaan Berbasis Web Menggunakan Metode Hybrid-Based Recommenda

(1)

BAB II

LANDASAN TEORI

Di dalam landasan teori ini, akan dibahas tentang teori – teori dan konsep dasar yang mendukung pembahasan dari sistem yang akan dibuat.

2.1Basis Data (Database)

Basis data diperlukan dalam pembuatan sebuah sistem sebagai inti dari sistem tersebut. Beberapa definisi lain tentang basis data adalah sebagai berikut:

1. Basis data adalah sebuah model dari beberapa aspek realitas pada sebuah organisasi (Kent, 1978).

2. Menurut Connolly dan Begg (2002), basis data adalah kumpulan dari data yang sering digunakan oleh sebuah sistem pada suatu organisasi.

3. Basis data menurut Sutanta (2004) adalah pengorganisasian sebuah kumpulan data yang saling terkait atau berhubungan sehingga memudahkan memperoleh informasi.

4. Database adalah sebuah struktur repositori dari suatu data.

(2)

2.1.1 Database Management System (DBMS)

Database management system (DBMS) adalah sebuah set dari fasilitas yang terorganisir untuk mengakses dan mempertahankan satu atau banyak basis data. Penggunaan DBMS dilakukan di dalam integrasi dari suatu sistem yang menggunakan data tersebut dalam sebuah perangkat lunak (Beynon-Davies, 2004). Menurut Beynon-Davies, DBMS dibagi atas 4 jenis yaitu:

1. Data definition : fungsinya yaitu pendefinisian struktur data baru yang masuk ke dalam sebuah database, menghapus struktur data dasi sebuah basis data dan memodifikasi struktur dari data yang sudah ada.

2. Data maintenance : fungsinya yaitu menyisipkan data baru, memperbaharui data dan menghapus data pada sebuah data struktur yang telah ada.

3. Data retrival : fungsinya yaitu, melakukan query pada data yang telah ada dan mengambil data untuk digunakan pada sebuah sistem.

4. Data Control : fungsinya yaitu, menciptakan dan memonitoring user dari basis data, membatasi akses data, dan memonitoring performa database.

2.2Sistem Rekomendasi (Recommender System)

Ada beberapa macam definisi dari sistem rekomendasi. Menurut Mahmood dan Ricci, Sistem Rekomendasi adalah peralatan perangkat lunak dan teknik yang menyediakan saran untuk items yang bisa digunakan oleh user. Secara general sistem rekomendasi didefinisikan sebagai sistem pendukung yang membantu user untuk mencari informasi, produk dan servis (buku, film, music dll) dengan menggabungkan dan menganalisa saran dari user lain, yang berarti meninjau dari beberapa pihak dan user

atribut (Frias-Martinex, 2006).

(3)

user (Melville dan Sindhwani, 2010). Sistem Rekomendasi menurut Melville dan Sindhwani, terbagi atas 3 jenis, yaitu:

1. Content-based Filtering 2. Collaborative Filtering 3. Hybrid-based Filtering

2.2.1 Content Based Filtering

Content-based filtering adalah sistem yang belajar untuk memberikan rekomendasi

item yang sama kepada user baru dengan membandingkan user yang terdahulu (Mahmod dan Ricci, 2009). Yang dimaksud dengan user yang baru dan user yang lama di sini adalah user baru sebagai data yang baru masuk dan user lama sebagai data yang telah masukkan dan sudah tersimpan di dalam database. Teknik – teknik yang digunakan dalam content-based seperti Bayesian Classifiers, Cluster analysis, decision trees dan artificial neural networks. Teknik – teknik tersebut dapat mengestimasi probabilitas perbandingan data lama dengan data baru.

2.2.2 Collaborative Filtering

Implementasi termudah dan original dari pendekatan rekomendasi ini untuk user aktif yang mempunyai kesamaan dengan user yang terdahulu (Schafer dkk, 2007). Kesamaan data pada 2 user dikalkulasi berdasarkan kesamaan history dari user.

Metode ini membandingkan koleksi data yang sama ataupun tidak sama dengan data yang baru dan kemudian dikalkulasi agar dapat diberikannya rekomendasi kepada

user. Teknik – teknik yang sering dipakai dalam metode ini adalah teknik tf-idf, nearest neighbor dan pearson Correlation.

2.2.3 Hybrid Based Filtering

Sistem rekomendasi ini berdasarkan oleh kombinasi dari content-based filtering dan

(4)

menggabungkan metode content-based filtering dengan collaborative filtering

mencoba menggunakan keunggulan dari content-based filtering untuk mengatasi masalah dari kekurangan collaborative filtering ataupun sebaliknya. Contohnya seperti pada metode content-based filtering hanya dapat mengklasifikasikan data. Tetapi sistem ingin memberikan rangking kepada user untuk rekomendasi item.

Maka dari itu sistem menggunakan metode collaborative filtering untuk mendapatkan perhitungan agar menghasilkan sebuah rangking rekomendasi yang dapat diberikan kepada user. Sehingga dengan menggabungkan dua metode tersebut, sistem akan memberikan hasil yang lebih baik dan lebih memuaskan kepada user.

2.3Metode Nearest Neighbor

Metode nearest neighbor langsung mengeksploitasi jarak antara data sampel untuk melakukan klasifikasi. Nearest neighbor secara independen mengevaluasi jarak antara data yang satu dengan data yang lain (Xu, Y. 2012). Rules nearest neighbor

mengidentifikasi katagori dari data poin yang baru (kasus baru) berdasarkan nearest neighbor dari data (kasus lama) yang telah diketahui nilainya (Vaidehi dan Vasuhi, 2008).

(5)

Gambar 2.1 Kedekatan kasus

Pada gambar 2.1 dapat dilihat bahwa terdapat dua kasus lama, yaitu kasus A dan kasus B. Pada saat kasus baru muncul, solusi yang digunakan untuk memcahkan kasus baru tersebut adalah dengan kasus lama A dikarenakan jarak 1 yaitu kasus baru dengan kasus A lebih dekat dibandingkan jarak 2 yaitu jarak kasus baru dengan kasus B. Maka diambil kesimpulan bahwa kasus baru dipecahkan oleh kasus A.

Untuk memperoleh rangking pada nearest neighbor, sistem melakukan perhitungan kedekatan (similarity) antara 2 kasus. Berikut adalah rumus dari yang digunakan di dalam metode nearest neighbor.

Dimana : T : Kasus baru

S : Kasus yang ada dalam memori/basisdata (kasus lama) n : Jumlah atribut dalam setiap kasus

i : atribut variabel antara 1 s/d n

f : fungsi similarity atribut i antara kasus T dan kasus S w : bobot yang diberikan pada atribut ke-i

Penentuan kedekatan biasanya berada pada nilai antara 0 s/d 1. Nilai 0 berarti bahwa kedua kasus mutlak tidak memiliki kesamaan, sebaliknya untuk nilai 1, berarti kasus tersebut mutlak memiliki kesamaan.

(6)

Klasifikasi data bisa dideskripsikan sebagai pengawas dari sebuah learning algoritm

di dalam proses mesin pembelajaran. Decision tree adalah sebuah representasi dari prosedur keputusan untuk menentukan kelas dan dikonstruksikan menjadi algoritma

non-incremental tree-induction atau algoritma incremental tree-induction (Utgoff, 1989).

dalam sistem pengambilan keputusan dan proses pembelajaran sistem yang menggunakan teknik prediksi modeling yang digunakan di dalam klasifikasi. Decision tree menggunakan teknik divide-conquer untuk memisahkan masalah menjadi bagian – bagian.

(7)

Gambar 2.2 Decision Tree

2.5Penelitian terdahulu

Di bagian ini akan dijabarkan beberapa penelitian terdahulu. Sistem rekomendasi telah banyak digunakan pada penelitian terdahulu. Seperti sistem rekomendasi pada bursa telepon genggam (2008) yang menggunakan content-based filtering dan sistem rekomendasi untuk sistem informasi toko film digital (2007) menggunakan metode

(8)

Untuk metode Hybrid-based filtering telah digunakan oleh (2010) pada sistem rekomendasi berita berbahasa indonesia yang menggunakan gabungan metode

clustering dan algoritma tf-dif. Kemudian digunakan juga oleh (2012) untuk memperoleh rekomendasi minat bakat siswa yang menggunakan metode Association Rule dan algoritma Apriori. Untuk lebih jelasnya, pada tabel 2.1 Berikut akan dijelaskan penelitian – penelitian yang telah dibuat sebelumnya.

Tabel 2.1 Penelitian terdahulu

No. Judul Tahun Metode yang

digunakan

Keterangan

1 Pembangunan

Perangkat Lunak Sistem

Rekomendasi Bursa

Elektronis Telepon

Genggam.

2008 content-based

filtering

Kelemahan :

ketidakmampuan sistem

memberikan rekomendasi

suatu informasi yang baru

karena rekomendasi

berdasarkan data yang lalu.

2 Metode Analisis

Rekomendasi Pada

Sistem Rekomendasi

(Contoh kasus

Pemanfaatan pada biro

wisata)

filtering, dan

association rules

Berdasarkan kepuasan

pelanggan (user

satisfaction) pemodelan

sistem rekomendasi

memiliki domain dan

wilayahnya masing-masing

dalam penyelesaian masalah

penentuan rekomendasi

Tabel 2.1 Penelitian terdahulu (lanjutan)

digunakan

Keterangan

3 Model Sistem Informasi

Toko Film Digital

Dengan Recommender

System

2007 Collaborative

Filtering

metode user

item

Keuntungan : dinamis dan

sederhana dalam

perhitungan rekomendasi

Kelemahan : masalah

(9)

akibat terlalu banyak item.

4 Studi Multi Criteria

Decision Making

(MCDM) untuk

Recommender System

Bursa Tenaga Kerja

2008 Multi Criterian

Decision

Making

(MCDM)

Kelebihan : metode

sederhana dan sesuai,

permasalahan pemilihan

alternatif yang jumlahnya

terbatas dan telah diketahui

sebelumnya.

5 Implementasi Sistem

Rekomendasi Berita

Berbahasa Indonesia

Berbasis Pilihan

Personal Menggunakan

Algoritma Hybrid

Filtering

2010 Algoritma

clustering dan

algoritma tf-dif

Algoritma clustering

digunakan untuk klasifikasi

berita

Keuntungan tf-dif :

pemberian bobot pada term

sehingga dapat mengetahui

term yang sering muncul

dalam dokumen secara

individu, namum jarang

dijumpai pada dokumen lain

6 Sistem Rekomendasi

Bidang Minat

Mahasiswa

menggunakan Metode

Association Rule dan

Algoritma Apriori

Aturan yang telah diinput

sebelumnya menjadi acuan

rekomendasi terhadap minat

user sehingga sistem dapat

memberika rekomendasi

Tabel 2.1 Penelitian terdahulu (lanjutan)

digunakan

Keterangan

7 Perancangan Sistem

Pendukung Keputusan

Kelemahan ID3 :

ketidakstabilan dalam

melakukan klasifikasi data

(10)

Kelaiklautan Kapal. perubahan pada data.

Kelebihan : dapat

menganalisa fungsi target

yang bernilai diskrit

8 Penerapan Data Mining

untuk menganalisa

kemungkinan

pengunduran diri calon

mahasiswa bar

2011 Algoritma

Decision tree

menggunakan

algoritma ID3

ID3 merupakan algoritma

dasar dalam decision tree

sehingga algoritma tersebut

lebih mudah dimengerti dan

digunakan

2011 Algoritma

Nearest

Neighbor dan

algoritma

Euclidean

Menanggulangi kelemahan

dari motede hybrid(content

dan collaborative) dengan

pendekatan baru yaitu

Algoritma Nearest Neighbor

10 Sistem rekomendasi

pembelian mobil

berbasis metode

Neuro-Fuzzy Classification

- metode

Neuro-Fuzzy

Classification

Penggabungan fuzzy logic

dengan neural network

untuk menanggulangi

kekurangan dari rule fuzzy

logic

11 Perbandingan metode

Nearest neigbor dan

algoritma C.45 untuk

menganalisis

kemungkinan

pengunduran diri calon

mahasiswa di STMIK

Yogyakarta

2009 Algoritma

Nearest

Neighbor dan

algoritma C4.5

Algoritma Nearest

Neighbor: tidak lebih akurat

dari C.45 tetapi pada saat

pengklasifikasian data

algoritma C.45

membutuhkan waktu yang

lebih lama dan proses yang