BAB II
LANDASAN TEORI
Di dalam landasan teori ini, akan dibahas tentang teori – teori dan konsep dasar yang mendukung pembahasan dari sistem yang akan dibuat.
2.1Basis Data (Database)
Basis data diperlukan dalam pembuatan sebuah sistem sebagai inti dari sistem tersebut. Beberapa definisi lain tentang basis data adalah sebagai berikut:
1. Basis data adalah sebuah model dari beberapa aspek realitas pada sebuah organisasi (Kent, 1978).
2. Menurut Connolly dan Begg (2002), basis data adalah kumpulan dari data yang sering digunakan oleh sebuah sistem pada suatu organisasi.
3. Basis data menurut Sutanta (2004) adalah pengorganisasian sebuah kumpulan data yang saling terkait atau berhubungan sehingga memudahkan memperoleh informasi.
4. Database adalah sebuah struktur repositori dari suatu data.
2.1.1 Database Management System (DBMS)
Database management system (DBMS) adalah sebuah set dari fasilitas yang terorganisir untuk mengakses dan mempertahankan satu atau banyak basis data. Penggunaan DBMS dilakukan di dalam integrasi dari suatu sistem yang menggunakan data tersebut dalam sebuah perangkat lunak (Beynon-Davies, 2004). Menurut Beynon-Davies, DBMS dibagi atas 4 jenis yaitu:
1. Data definition : fungsinya yaitu pendefinisian struktur data baru yang masuk ke dalam sebuah database, menghapus struktur data dasi sebuah basis data dan memodifikasi struktur dari data yang sudah ada.
2. Data maintenance : fungsinya yaitu menyisipkan data baru, memperbaharui data dan menghapus data pada sebuah data struktur yang telah ada.
3. Data retrival : fungsinya yaitu, melakukan query pada data yang telah ada dan mengambil data untuk digunakan pada sebuah sistem.
4. Data Control : fungsinya yaitu, menciptakan dan memonitoring user dari basis data, membatasi akses data, dan memonitoring performa database.
2.2Sistem Rekomendasi (Recommender System)
Ada beberapa macam definisi dari sistem rekomendasi. Menurut Mahmood dan Ricci, Sistem Rekomendasi adalah peralatan perangkat lunak dan teknik yang menyediakan saran untuk items yang bisa digunakan oleh user. Secara general sistem rekomendasi didefinisikan sebagai sistem pendukung yang membantu user untuk mencari informasi, produk dan servis (buku, film, music dll) dengan menggabungkan dan menganalisa saran dari user lain, yang berarti meninjau dari beberapa pihak dan user
atribut (Frias-Martinex, 2006).
user (Melville dan Sindhwani, 2010). Sistem Rekomendasi menurut Melville dan Sindhwani, terbagi atas 3 jenis, yaitu:
1. Content-based Filtering 2. Collaborative Filtering 3. Hybrid-based Filtering
2.2.1 Content Based Filtering
Content-based filtering adalah sistem yang belajar untuk memberikan rekomendasi
item yang sama kepada user baru dengan membandingkan user yang terdahulu (Mahmod dan Ricci, 2009). Yang dimaksud dengan user yang baru dan user yang lama di sini adalah user baru sebagai data yang baru masuk dan user lama sebagai data yang telah masukkan dan sudah tersimpan di dalam database. Teknik – teknik yang digunakan dalam content-based seperti Bayesian Classifiers, Cluster analysis, decision trees dan artificial neural networks. Teknik – teknik tersebut dapat mengestimasi probabilitas perbandingan data lama dengan data baru.
2.2.2 Collaborative Filtering
Implementasi termudah dan original dari pendekatan rekomendasi ini untuk user aktif yang mempunyai kesamaan dengan user yang terdahulu (Schafer dkk, 2007). Kesamaan data pada 2 user dikalkulasi berdasarkan kesamaan history dari user.
Metode ini membandingkan koleksi data yang sama ataupun tidak sama dengan data yang baru dan kemudian dikalkulasi agar dapat diberikannya rekomendasi kepada
user. Teknik – teknik yang sering dipakai dalam metode ini adalah teknik tf-idf, nearest neighbor dan pearson Correlation.
2.2.3 Hybrid Based Filtering
Sistem rekomendasi ini berdasarkan oleh kombinasi dari content-based filtering dan
menggabungkan metode content-based filtering dengan collaborative filtering
mencoba menggunakan keunggulan dari content-based filtering untuk mengatasi masalah dari kekurangan collaborative filtering ataupun sebaliknya. Contohnya seperti pada metode content-based filtering hanya dapat mengklasifikasikan data. Tetapi sistem ingin memberikan rangking kepada user untuk rekomendasi item.
Maka dari itu sistem menggunakan metode collaborative filtering untuk mendapatkan perhitungan agar menghasilkan sebuah rangking rekomendasi yang dapat diberikan kepada user. Sehingga dengan menggabungkan dua metode tersebut, sistem akan memberikan hasil yang lebih baik dan lebih memuaskan kepada user.
2.3Metode Nearest Neighbor
Metode nearest neighbor langsung mengeksploitasi jarak antara data sampel untuk melakukan klasifikasi. Nearest neighbor secara independen mengevaluasi jarak antara data yang satu dengan data yang lain (Xu, Y. 2012). Rules nearest neighbor
mengidentifikasi katagori dari data poin yang baru (kasus baru) berdasarkan nearest neighbor dari data (kasus lama) yang telah diketahui nilainya (Vaidehi dan Vasuhi, 2008).
Gambar 2.1 Kedekatan kasus
Pada gambar 2.1 dapat dilihat bahwa terdapat dua kasus lama, yaitu kasus A dan kasus B. Pada saat kasus baru muncul, solusi yang digunakan untuk memcahkan kasus baru tersebut adalah dengan kasus lama A dikarenakan jarak 1 yaitu kasus baru dengan kasus A lebih dekat dibandingkan jarak 2 yaitu jarak kasus baru dengan kasus B. Maka diambil kesimpulan bahwa kasus baru dipecahkan oleh kasus A.
Untuk memperoleh rangking pada nearest neighbor, sistem melakukan perhitungan kedekatan (similarity) antara 2 kasus. Berikut adalah rumus dari yang digunakan di dalam metode nearest neighbor.
Dimana : T : Kasus baru
S : Kasus yang ada dalam memori/basisdata (kasus lama) n : Jumlah atribut dalam setiap kasus
i : atribut variabel antara 1 s/d n
f : fungsi similarity atribut i antara kasus T dan kasus S w : bobot yang diberikan pada atribut ke-i
Penentuan kedekatan biasanya berada pada nilai antara 0 s/d 1. Nilai 0 berarti bahwa kedua kasus mutlak tidak memiliki kesamaan, sebaliknya untuk nilai 1, berarti kasus tersebut mutlak memiliki kesamaan.
Klasifikasi data bisa dideskripsikan sebagai pengawas dari sebuah learning algoritm
di dalam proses mesin pembelajaran. Decision tree adalah sebuah representasi dari prosedur keputusan untuk menentukan kelas dan dikonstruksikan menjadi algoritma
non-incremental tree-induction atau algoritma incremental tree-induction (Utgoff, 1989).
dalam sistem pengambilan keputusan dan proses pembelajaran sistem yang menggunakan teknik prediksi modeling yang digunakan di dalam klasifikasi. Decision tree menggunakan teknik divide-conquer untuk memisahkan masalah menjadi bagian – bagian.
Gambar 2.2 Decision Tree
2.5Penelitian terdahulu
Di bagian ini akan dijabarkan beberapa penelitian terdahulu. Sistem rekomendasi telah banyak digunakan pada penelitian terdahulu. Seperti sistem rekomendasi pada bursa telepon genggam (2008) yang menggunakan content-based filtering dan sistem rekomendasi untuk sistem informasi toko film digital (2007) menggunakan metode
Untuk metode Hybrid-based filtering telah digunakan oleh (2010) pada sistem rekomendasi berita berbahasa indonesia yang menggunakan gabungan metode
clustering dan algoritma tf-dif. Kemudian digunakan juga oleh (2012) untuk memperoleh rekomendasi minat bakat siswa yang menggunakan metode Association Rule dan algoritma Apriori. Untuk lebih jelasnya, pada tabel 2.1 Berikut akan dijelaskan penelitian – penelitian yang telah dibuat sebelumnya.
Tabel 2.1 Penelitian terdahulu
No. Judul Tahun Metode yang
digunakan
Keterangan
1 Pembangunan
Perangkat Lunak Sistem
Rekomendasi Bursa
Elektronis Telepon
Genggam.
2008 content-based
filtering
Kelemahan :
ketidakmampuan sistem
memberikan rekomendasi
suatu informasi yang baru
karena rekomendasi
berdasarkan data yang lalu.
2 Metode Analisis
Rekomendasi Pada
Sistem Rekomendasi
(Contoh kasus
Pemanfaatan pada biro
wisata)
filtering, dan
association rules
Berdasarkan kepuasan
pelanggan (user
satisfaction) pemodelan
sistem rekomendasi
memiliki domain dan
wilayahnya masing-masing
dalam penyelesaian masalah
penentuan rekomendasi
Tabel 2.1 Penelitian terdahulu (lanjutan)
No. Judul Tahun Metode yang
digunakan
Keterangan
3 Model Sistem Informasi
Toko Film Digital
Dengan Recommender
System
2007 Collaborative
Filtering
metode user
item
Keuntungan : dinamis dan
sederhana dalam
perhitungan rekomendasi
Kelemahan : masalah
akibat terlalu banyak item.
4 Studi Multi Criteria
Decision Making
(MCDM) untuk
Recommender System
Bursa Tenaga Kerja
2008 Multi Criterian
Decision
Making
(MCDM)
Kelebihan : metode
sederhana dan sesuai,
permasalahan pemilihan
alternatif yang jumlahnya
terbatas dan telah diketahui
sebelumnya.
5 Implementasi Sistem
Rekomendasi Berita
Berbahasa Indonesia
Berbasis Pilihan
Personal Menggunakan
Algoritma Hybrid
Filtering
2010 Algoritma
clustering dan
algoritma tf-dif
Algoritma clustering
digunakan untuk klasifikasi
berita
Keuntungan tf-dif :
pemberian bobot pada term
sehingga dapat mengetahui
term yang sering muncul
dalam dokumen secara
individu, namum jarang
dijumpai pada dokumen lain
6 Sistem Rekomendasi
Bidang Minat
Mahasiswa
menggunakan Metode
Association Rule dan
Algoritma Apriori
Aturan yang telah diinput
sebelumnya menjadi acuan
rekomendasi terhadap minat
user sehingga sistem dapat
memberika rekomendasi
Tabel 2.1 Penelitian terdahulu (lanjutan)
No. Judul Tahun Metode yang
digunakan
Keterangan
7 Perancangan Sistem
Pendukung Keputusan
Kelemahan ID3 :
ketidakstabilan dalam
melakukan klasifikasi data
Kelaiklautan Kapal. perubahan pada data.
Kelebihan : dapat
menganalisa fungsi target
yang bernilai diskrit
8 Penerapan Data Mining
untuk menganalisa
kemungkinan
pengunduran diri calon
mahasiswa bar
2011 Algoritma
Decision tree
menggunakan
algoritma ID3
ID3 merupakan algoritma
dasar dalam decision tree
sehingga algoritma tersebut
lebih mudah dimengerti dan
digunakan
2011 Algoritma
Nearest
Neighbor dan
algoritma
Euclidean
Menanggulangi kelemahan
dari motede hybrid(content
dan collaborative) dengan
pendekatan baru yaitu
Algoritma Nearest Neighbor
10 Sistem rekomendasi
pembelian mobil
berbasis metode
Neuro-Fuzzy Classification
- metode
Neuro-Fuzzy
Classification
Penggabungan fuzzy logic
dengan neural network
untuk menanggulangi
kekurangan dari rule fuzzy
logic
11 Perbandingan metode
Nearest neigbor dan
algoritma C.45 untuk
menganalisis
kemungkinan
pengunduran diri calon
mahasiswa di STMIK
Yogyakarta
2009 Algoritma
Nearest
Neighbor dan
algoritma C4.5
Algoritma Nearest
Neighbor: tidak lebih akurat
dari C.45 tetapi pada saat
pengklasifikasian data
algoritma C.45
membutuhkan waktu yang
lebih lama dan proses yang