• Tidak ada hasil yang ditemukan

BAB 2. LANDASAN TEORI

N/A
N/A
Protected

Academic year: 2021

Membagikan "BAB 2. LANDASAN TEORI"

Copied!
7
0
0

Teks penuh

(1)

BAB 2. LANDASAN TEORI

Pada bab ini dijelaskan mengenai teori yang digunakan untuk membuat aplikasi Sistem Rekomendasi Mata Kuliah Pilihan yaitu Metode Collaborative

Filtering, Algoritma Adjusted Cosine Similarity dan Mean Absolute Error.

2.1. Data Mining

Data Mining atau Penggalian Data merupakan suatu proses mencari pola

yang menarik dari suatu data yang memiliki karakteristik jumlah data yang besar. Pola yang dikategorikan sebagai pola yang menarik apabila pola tersebut tidak sederhana, implisit, tidak diketahui sebelumnya. (Wikipedia, 2018).

Untuk dapat mencari suatu pola dari suatu data dalam jumlah yang besar, urutan proses yang dapat dilakukan adalah (Wikipedia, 2018):

1. Pembersihan Data.

Menghilangkan data yang bersifat noise / data yang bersifat tidak valid. 2. Integrasi Data.

Proses penggabungan berbagai sumber data. 3. Pemilihan Data.

Proses memilih data yang relevan sesuai dengan konteks yang diinginkan.

4. Transformasi Data.

Proses melakukan transformasi data menjadi format yang sesuai dan siap untuk diproses pada tahap selanjutnya.

5. Penggalian Data.

Proses menerapkan suatu metode dan algoritma untuk melakukan ekstraksi pada pola.

6. Evaluasi Pola.

Proses mengenali pola data yang menarik. 7. Penyajian Pola.

Proses visualisasi dari pola yang ditemukan agar dapat dipahami user.

(2)

2.2. Collaborative Filtering Sebagai Sistem Rekomendasi

Sistem rekomendasi merupakan suatu sistem yang dapat memberikan informasi dan rekomendasi yang membantu user dalam membuat keputusan berdasarkan data yang telah ada sebelumnya.

Salah satu metode yang dipergunakan dalam pembuatan suatu sistem rekomendasi yang terkenal hingga saat ini adalah Collaborative Filtering. Pada implementasi Collaborative Filtering dalam sistem rekomendasi mata kuliah

pilihan, data yang dibandingkan akan disimpan dalam sebuah matriks dua dimensi dimana dimensi dari y atau baris akan menyatakan mahasiswa dan dimensi x atau kolom akan menyatakan mata kuliah.

2.3. Proses Collaborative Filtering

Ide dasar dari menghitung similarity antara mahasiswa U1 dengan Um

adalah dengan membandingkan data semua nilai mata kuliah yang dari mahasiswa U1 dengan Um untuk menghasilkan nilai prediksi pada mata kuliah yang belum pernah diambil oleh mahasiswa Um. Penerapan metode ini dilakukan dengan mencari semua user aktif yang memiliki nilai Top-K similarity paling tinggi dengan mahasiswa Um. Setelah ditemukan Top-K mahasiswa yang memiliki nilai similarity tertinggi dengan mahasiswa Um, maka akan dilakukan perhitungan nilai prediksi pada mata kuliah yang belum pernah diambil oleh user Um. Berdasarkan pada hasil nilai prediksi ini, maka akan ditentukan mata kuliah terbaik yang akan direkomendasikan kepada mahasiswa. Penggambaran secara lebih jelas dapat dilihat pada Gambar 2.1 dan Gambar 2.2.

Collaborative Filtering Process (Sarwar, Karypis, Konstan, & Riedl, 2001 )

(3)

Isolation of the Co-rated Users and Similarity Computation (Yao & Cai, 2015).

Dalam Collaborative Filtering terdapat dua metode yang dapat digunakan yaitu Item Based Collaborative Filtering dan User Based Collaborative Filtering. 2.3.2. Item Based Collaborative Filtering

Item Based Collaborative Filtering merupakan suatu metode yang

memberikan rekomendasi item dengan mencari item lain yang memiliki Top-K

similarity item dengan item tersebut.

Kelebihan Item Based Collaborative Filtering (Sarwar, Karypis, Konstan, & Riedl, 2001 ):

 Scalability

Dengan menggunakan metode ini model yang dihasilkan sangat kecil dibandingkan dengan dataset yang sebenarnya, meskipun diterapkan pada dataset yang lebih besar sekalipun, model yang dihasilkan masih sangat kecil untuk digunakan secara efisien.

 Prediction Speed

Lebih cepat dibandingkan dengan User-Based dikarenakan dataset yang digunakan dalam proses prediksi jauh lebih kecil.

 Lebih baik dipergunakan pada karakteristik data dimana terdapat perbedaan jumlah item yang besar antara user yang satu dengan user yang lainnya.

(4)

Kelemahan Item Based Collaborative Filtering (Sarwar, Karypis, Konstan, & Riedl, 2001 )

 Inflexibility

Ketika terjadi penambahan item baru maka harus dilakukan perubahan pada query.

2.3.3. User Based Collaborative Filtering

User Based Collaborative Filtering merupakan suatu metode yang

memberikan rekomendasi item dengan membandingkan semua item pada semua

user aktif dengan user tertentu untuk mencari Top-K similarity user aktif dengan user tertentu.

Kelebihan User Based Collaborative Filtering (Sarwar, Karypis, Konstan, & Riedl, 2001 ):

 Algoritma dapat digunakan pada banyak kondisi.

 Sangat mudah dalam melakukan update pada database dikarenakan pada algoritma ini prediksi selalu dilakukan berdasarkan pada semua user pada database.

 Lebih cocok dipergunakan pada karakteristik data dimana perbedaan jumlah item yang dimiliki oleh user yang satu dengan lainnya kecil atau bersifat merata.

Kelemahan User Based Collaborative Filtering (Sarwar, Karypis, Konstan, & Riedl, 2001 )

 Membutukan waktu yang lama.

Hal ini dikarenakan setiap terjadi penambahan data user baru, akan dilaukan update pada nilai prediksi.

User Based Collaborative Filtering dipilih berdasarkan karakteristik data

(5)

angkatan berserta dengan jumlah sks mata kuliah yang sama bagi setiap mahasiswa disetiap angkatan untuk mencapai kelulusan yaitu 144 sks.

2.4. Algoritma pada Collaborative Filtering

Dalam penggunaan dari metode pada Collaborative Filtering, terdapat algoritma yang dipergunakan sebagai basis dalam perhitungan pada metode

Collaborative Filtering yang telah dipilih.

Dua macam algoritma yang dapat digunakan dalam menentukan nilai similarity diantaranya adalah:

2.4.1. Cosine Similarity

Cosine Similarity atau Vector Based Similarity merupakan algoritma

dimana nilai similarity antara i dan j digambarkan sebagai suatu sudut yang terbentuk diantara 2 buah vektor (Sarwar, Karypis, Konstan, & Riedl, 2001 ). Pada algoritma ini apabila terdapat mahasiswa yang belum mengambil mata kuliah maka nilai pada mata kuliah tersebut akan dianggap sebagai nilai terendah yaitu 0.

Rumus dari Cosine Similarity dapat dinyatakan sebagai berikut :

𝑠𝑖𝑚(𝑖, 𝑗) = cos(𝑖⃗, 𝑗⃗) =

𝑖⃗ . 𝑗⃗

‖𝑖⃗‖

2

∗ ‖𝑗⃗‖

2

(2. 1)

2.4.2. Adjusted Cosine Similarity

Adjusted Cosine Similarity merupakan pengembangan dari Cosine Similarity dimana terdapat pertimbangan akan adanya data / nilai yang kosong

yang tidak dimiliki oleh user sehingga perlu dilakukan suatu normalisasi pada data untuk menjadikan data nilai kosong yang diasumsikan menggunakan 0 menjadi sebuah nilai tengah. Dalam studi kasus mata kuliah artinya terdapat mata kuliah yang belum diambil oleh mahasiswa. Algoritma Adjusted Cosine Similarity ini dipilih dikarenakan dengan menggunakan algoritma ini maka nilai 0 yang mewakili nilai dari mata kuliah yang belum diambil oleh mahasiswa tidak lagi menjadi nilai

(6)

terendah , namun menjadi nilai tengah dari perhitungan similarity sehingga dihasilkan hasil yang lebih akurat.

Rumus dari Adjusted Cosine Similarity dapat dinyatakan sebagai berikut:

𝑠𝑖𝑚(𝑖, 𝑗) =

𝑢 ∈ 𝑈

(𝑅

𝑢,𝑖

− 𝑅̅

𝑖

)(𝑅

𝑢,𝑗

− 𝑅̅

𝑗

)

√∑

𝑢 ∈ 𝑈

(𝑅

𝑢,𝑖

− 𝑅̅

𝑖

)

2

√∑

𝑢 ∈ 𝑈

(𝑅

𝑢,𝑗

− 𝑅̅

𝑗

)

2

(2. 2) Dimana:

- i merupakan mahasiswa yang nilainya akan diprediksi.

- j merupakan mahassiwa yang datanya digunakan untuk memprediksi. -

𝑠𝑖𝑚(𝑖, 𝑗)

merupakan nilai similarity antara i dan j.

-

𝑅

𝑢,𝑖 merupakan nilai mata kuliah u dari mahasiswa i. -

𝑅

𝑢,𝑗merupakan nilai mata kuliah u dari mahasiswa j.

-

𝑅̅

𝑗merupakan nilai rata-rata dari semua mata kuliah dari mahasiswa j. -

𝑅̅

𝑖 merupakan nilai rata-rata dari semua mata kuliah dari mahasiswa i.

2.5. Nilai Prediksi

Setelah dilakukan perhitungan similarity untuk mencari Top-K mahasiswa yang memiliki similarity yang tertinggi dengan mahasiswa Um maka langkah yang dilakukan adalah menghitung nilai prediksi pada mata kuliah yang belum diambil oleh mahasiswa Um berdasarkan pada data nilai mata kuliah dari semua Top-K mahasiswa (Yanti, Rahmi, & Ruliah, 2013).

Rumus dari Nilai Prediksi dapat dinyatakan sebagai berikut :

𝑃

𝑢,𝑖

= 𝑅̅

𝑎

+

(

𝑅

𝑢,𝑖

− 𝑅

̅

𝑖

)

∗ 𝑆

𝑖,𝑗 𝑖 ∈ 𝑈

𝑖 ∈ 𝑈

|

𝑆

𝑖,𝑗

|

(2. 3)

(7)

Dimana:

- i merupakan mahasiswa yang nilainya akan diprediksi.

- j merupakan mahassiwa yang datanya digunakan untuk memprediksi. -

𝑃

𝑢,𝑖adalah nilai prediksi mata kuliah yang dari mahasiswa i pada mata

kuliah u.

- 𝑖 ∈ 𝑈 merupakan Top-K mahasiswa yang memiliki similarity paling tinggi dengan mahasiswa.

-

𝑅̅

𝑎 merupakan rata-rata dari semua mata kuliah mahasiswa yang dicari. -

𝑅

𝑢,𝑖 merupakan nilai mata kuliah mahasiswa i terhadap mata kuliah u. -

𝑅̅

𝑖

merupakan nilai rata-rata dari semua mata kuliah dari mahasiswa u.

-

𝑆

𝑖,𝑗adalah nilai similarity.

2.6. MAE (Mean Average Factor)

MAE digunakan untuk menghitung rata-rata perbedaan secara mutlak antara nilai mata kuliah prediksi dengan nilai mata kuliah sebenarnya (Badriyah, Restuningtyas, & Setyorini, 2017). Jika

𝑃

𝑢,𝑖 adalah nilai prediksi mata kuliah dari mahasiswa u untuk mata kuliah i, maka

𝑅

𝑢,𝑖 adalah nilai mata kuliah yang sebenarnya.

Persamaan MAE dirumuskan sebagai berikut :

𝑀𝐴𝐸 =

{𝑢,𝑖}

|

𝑃

𝑢,𝑖

𝑅

𝑢,𝑖

|

N

(2. 4)

Dimana :

- i merupakan mahasiswa yang nilainya akan diprediksi.

-

𝑃

𝑢,𝑖 adalah nilai prediksi mata kuliah yang dari mahasiswa i pada mata kuliah u.

-

𝑅

𝑢,𝑖 adalah nilai mata kuliah yang sebenarnya dari mahasiswa i. -

N

adalah jumlah data.

Referensi

Dokumen terkait

Jadi, persepsi terhadap kepemimpinan transformasional adalah cara pandang karyawan pramuniaga terhadap kemampuan pemimpin toko buku Gramedia Padang dalam mengubah

adalah karya tulis ilmiah berupa paparan hasil penelitian yang membahas suatu masalah dalam bidang ilmu hukum untuk mencari pemecahan masalahnya dengan menggunakan teori-teori,

Selain mengokohkan merk Pondok sebagai salah satu produsen kue Satu yang paling dikenal di Madiun, dengan perancangan ulang produk kue Satu Pondok diberbagai aspek seperti

Pada penelitian yang dilakukan oleh (Wuryanto & Insani, 2013) yang berjudul “Tingkat Kesiapan (Readiness) Implementasi E- Learning di Sekolah Menengah Atas Kota

Penelitian ini bertujuan untuk mengetahui komposisi vegetasi ekosistem mangrove yang terdiri dari tingkat kerapatan, frekuensi, dominansi dan nilai indeks penting (INP)

(ah, jika jumlah modal usaha yang anda miliki tidak menapai angka itu, maka anda masih bisa tetap berbisnis elpiji dengan menjadi sub agen atau pangkalan agen. Sub agen

Pada gambar 3.8 diagram aktivitas pelaporan, bagian rekap, kasir, dan bagian kredit masing-masing melakukan request atau permintaan laporan data melalui sistem aplikasi yang

Dari segi inovasi Bisnis, Bluesville perlu lebih melakukan diversifikasi produk untuk memperkaya sumber potensi dari produk itu sendiri, dengan menggunakan budaya