Rekomendasi Resep Masakan Berdasarkan Ketersediaan Bahan Masakan Menggunakan Metode N-Gram dan Cosine Similarity

(1)

Fakultas Ilmu Komputer

Universitas Brawijaya 1524

Rekomendasi Resep Masakan Berdasarkan Ketersediaan Bahan Masakan Menggunakan Metode N-Gram dan Cosine Similarity

Ratna Tri Utami¹, Yuita Arum Sari², Indriati³

Program Studi Teknik Informatika, Fakultas Ilmu Komputer, Universitas Brawijaya Email: ¹[email protected], ²[email protected], ³[email protected]

Abstrak

Resep masakan merupakan pedoman seorang ibu rumah tangga dalam membuat sebuah masakan.

Banyaknya resep masakan yang ada memudahkan para ibu rumah tangga untuk memasak. Namun pada kenyatannya masih banyak yang belum paham kecocokan antara komposisi bahan masakan dengan masakan yang akan dibuat. Sehingga diperlukan inovasi untuk memudahkan pencarian resep masakan yang sesuai dengan komposisi bahan masakan yang tersedia. Hal tersebut dapat dituangkan dalam sebuah bentuk sistem temu kembali informasi. Metode N-gram dan cosine similarity dapat digunakan untuk mencocokkan bahan masakan yang tersedia dengan resep masakan yang dianjurkan. Kelebihan metode cosine similarity adalah tidak terpengaruh pada panjang pendeknya suatu dokumen teks, karena yang diperhitungkan hanya nilai term dari masing-masing dokumen. Metode N-gram terdiri dari 3 jenis proses yaitu unigram, bigram, trigram yang berfungsi untuk pengolahan kata. Pada penelitian ini dibangun sebuah model pencarian rekomendasi resep masakan yang relevan menggunakan metode N- gram dan cosine similarity. Uji coba yang dilakukan adalah pengukuran kemiripan dan penentuan threshold. Hasil yang didapat bahwa sistem berhasil menghitung kemiripan dengan nilai cosine 0,9.

Semakin besar nilainya maka semakin mendekati rekomendasi resep masakan yang sesuai dengan query. Dari hasil ketiga proses N-gram yang terbaik adalah unigram dengan nilai threshold lebih dari sama dengan 90% dan nilai recall 1 serta precision 0,2. Dapat disimpulkan bahwa unigram merupakan proses metode N-gram yang terbaik untuk merekomendasikan resep masakan berdasarkan bahan masakan.

Kata kunci: Rekomendasi, Resep Masakan, N-gram, Cosine Similarity, Sistem Temu Kembali Informasi Abstract

Cooking recipes are the guidelines of a housewife in making a dish. Many recipes that there are easy for housewives to cook. But the reality, there are still a lot of housewife who doesn’t understood the compatibility between the composition of cooking materials with dishes to be made. So it takes innovation to facilitate the search for a recipe in accordance with the composition of the available ingredients. It can be included in a form of information retrieval system. N-gram and cosine similarity methods can be used to match the available ingredients with the recommended recipes. Excess cosine similarity method didnt affect by the short length of a text document, because it just calculated only the term value of each document. The N-gram method consists of 3 types of processes: unigram, bigram, trigram which are serves for word processing. In this research, a model for recommendation of relevant recipes using N-gram method and cosine similarity was developed. The tests performed were the measurement of similarity and threshold determination. The results obtained that the system succeeded in calculating the similarity with the value of cosine 0.9. The greater of the value so it closer to the recommendation of the recipe in accordance with the query. From the third results of the best N-gram process is unigram with a threshold value is greater than or equal to 90% and a recall value of 1 and precision 0,2. It can be concluded that unigram is the best N-gram method process to recommend the recipes based on the ingredient.

Keywords: Recommendation, Recipes, N-gram, Cosine Similarity, Information Retrieval System

(2)

1. PENDAHULUAN

Dalam kehidupan sehari-hari memasak adalah aktifitas yang dilakukan oleh masyarakat dalam mengolah makanan. Menghasilkan suatu masakan yang enak membutuhkan pengalaman dan keterampilan dalam mengolah bahan masakan menggunakan peralatan memasak yang memadai (Bestari, 2011). Dalam kondisi sekarang para ibu rumah tangga lebih banyak memilih membeli makanan di warung-warung daripada memasak sendiri. Salah satu factor penyebabnya adalah kurangnya pengetahuan ibu rumah tangga dalam mengolah bahan makanan.

Untuk menghasilkan hidangan masakan yang enak dan menarik dibutuhkan suatu resep masakan dalam proses memasak. Resep masakan merupakan petunjuk penggunaan bahan makanan, bumbu dan tata cara yang digunakan untuk mengolah bahan makanan (Lestari, 2012). Di era sekarang sudah banyak informasi mengenai resep masakan yang dibagikan di internet salah satunya yaitu media sosial. Dalam kehidupan sehari-hari banyak masyarakat yang hampir setiap waktu mengakses media sosial. Informasi resep masakan yang sudah banyak dibagikan di internet adalah keuntungan bagi ibu rumah tangga agar lebih mudah dalam mencari resep masakan yang diinginkan.

2.

3.

4.

5.

6.

7.

8.

9.

10.

11.

12.

13.

14.

15.

16.

17.

18.

19.

20.

21.

Algoritma cosine similarity berfungsi untuk mengetahui resep masakan yang paling mendekati keinginan pengguna. Sehingga diperlukan perhitungan kemiripan antara resep

masakan menggunakan fungsi similarity.

Kesimpulan dari penelitian ini akan membahas Rekomendasi Resep Masakan Berdasarkan Bahan Masakan dengan Metode N- gram dan Cosine Similarity. Implementasi dari Rekomendasi Resep Masakan menghasilkan yang relevan dari yang direkomendasikan.

2. DATA DAN METODE 2.1 Dataset

Penggunaan dataset dalam bentuk dokumen resep masakan yang diambil dari sumber situs https://cookpad.com dan dipilih secara manual. Jumlah data latih yaitu 100 dokumen resep masakan. Data uji adalah query yang dimasukkan ke menu pencarian.

2.2 Metode Usulan

Penelitian ini melakukan pencarian rekomendasi resep masakan menggunakan metode N-Gram dan cosine similarity. Berikut adalah diagram alir pada Gambar 1. Proses dimulai dengan memasukkan query (kata kunci) bahan masakan, setelah itu dilakukan proses preprocessing yang terdiri dari case folding dan tokenisasi terhadap seluruh data resep masakan.

Hasil dari preprocessing kemudian dibagi-bagi per kata menggunakan metode N-Gram.

Selanjutnya akan dilakukan pembobotan TF- IDF sebelum dilakukan normalisasi. Proses terakhir yaitu menghitung nilai kemiripan resep masakan dengan query (kata kunci) bahan masakan dan diurutkan berdasarkan nilai rangking tertinggi.

(3)

Gambar 1 Diagram Alir Metode 2.3 Preprocessing Text

Preprocessing merupakan metode pemilihan kata menggunakan indeks. Indeks merupakan kata yang pembuatan pemodelan untuk Information Retrieval. Proses Preprocessing bertujuan merubahdata yang belum terstruktur menjadi data yang terstruktur sesuai dengan kebutuhan (Even, Yahir Zohar, 2002).

2.4 Case Folding

Case folding merupakan menjadikan huruf besar menjadi huruf kecil, seperti hanya huruf

‘a’ sampai dengan ‘z’ yang diterima. Karakter selain huruf dihilangkan dan dianggap delimeter.

(Even, Yahir Zohar, 2002).

2.5 Tokenisasi

Tokenisasi merupakan proses pemecahan string menjadi tiap kata. Proses tokenisasi akan memisahkan kata dari suatu dokumen.

Tokenisasi ini akan menghilangkan angka, tanda baca dan karakter selain huruf alfabet, karakter- karakter yang dianggap sebagai pemisah kata (delimiter) dan tidak memiliki pengaruh terhadap pemrosesan teks. (Even, Yahir Zohar,2002).

2.6 Pembobotan Kata (Term)

Pembobotan kata akan dilakukan menggunakan metode TF-IDF (Term Frequency Inverse Document Frequency). Metode tersebut akan menghasilkan nilai bobot term atau kata pada tiap dokumen berdasarkan frekuensi kemunculan term atau kata didalam dokumen.

Nilai dari frekuensi kemunculan suatu term atau kata sangat diperhitungkan dalam memberikan bobot pada tiap term atau kata. (Robertson, 2005).

a. Term Frequency (TF) dan Pembobotan TF (WTF)

Term Frequency (TF) merupakan merupakan frekuensi kemunculan kata (t) pada kalimat (d). Dan WTF merupakan menghitung pembobotan tiap kata. Ditunjukan pada persamaan 1. (Nathania dkk, 2017).

𝑊_𝑡𝑓_𝑡,𝑑 = {1 + 𝑙𝑜𝑔₁₀𝑡𝑓_𝑡,𝑑, 𝑑𝑖𝑚𝑎𝑛𝑎 𝑡𝑓_𝑡,𝑑> 0

0, 𝑑𝑖𝑚𝑎𝑛𝑎 𝑡𝑓_𝑡,𝑑= 0 (1) Keterangan:

- 𝑊𝑡𝑓_𝑡,𝑑: Hasil dari pembobotan 𝑡𝑓_𝑡,𝑑

- 𝑡𝑓𝑡,𝑑 : Frekuensi kemunculan t pada dokumen d.

b. Document Frequency (DFt) dan Inverse Document Frequency (IDFt)

Document Frequency (DFt) adalah banyaknya klaimat dimana suatu kata (t) muncul. Dan Inverse Document Frequency adalah jumlah kemunculan term pada seluruh kalimat dalam dokumen. IDF dapat dihitung menggunakan persamaan 2 (Nathania, 2017).

(4)

𝑖𝑑𝑓_𝑡 = 𝑙𝑜𝑔₁₀𝑁/𝑑𝑓_𝑡 (2) Keterangan:

- 𝑖𝑑𝑓_𝑡 : Hasil dari invers 𝑑𝑓_𝑡

- 𝑑𝑓𝑡 : Jumlah dokumen yang memiliki t - 𝑁 : Banyak dokumen yang ada c. Pembobotan TF-IDF (Wt,d)

Pembobotan TF-IDF (Wt,d) adalah mengalikan pembobotan TF dan IDFt, dapat menggunakan persamaan 3 (Nathania, 2017) 𝑊_𝑡,𝑑 = 𝑊_𝑡𝑓_𝑡,𝑑∗ 𝑖𝑑𝑓_𝑡 (3) d. Normalisasi

Normalisasi diperlukan karena dimana dokumen panjang akan berpotensi mengandung nilai yang besar karena memiliki tingkat kemunculan term yang besar, rumus perhitungan normalisasi dapat dilihat pada persamaan 4 (Nathania, 2017).

𝑤_𝑡,𝑑 = ^𝑤^𝑡,𝑑

√∑^𝑛_𝑡=1𝑤_𝑡,𝑑²

(4)

2.7 N-gram

N-Gram adalah bagian dari N-karakter yang diambil dari string. Kita bisa mendapatkan N- Gram penuh dengan menambahkan kosong atau karakter lain di awal dan akhir string. Misalnya string "TEXT" setelah ditambahkan dengan "_"

di awal dan akhir akan mendapatkan Ngram sebagai berikut:

Unigram : T,E,K,S

Bigram : _T, TE, EK, KS, dan S Trigram : _TE,TEK,EKS, KS_ dan S_ _

Sebuah kata dengan panjang k ditambahkan dengan garis bawah, akan memiliki k+1 bigram, k+1 trigram, k+1 quadgram.

2.8 Cosine Similarity

Metode cosine similarity adalah mengukur persamaan dua teks atau dokumen yang berbeda dengan mengukur cosinus dari sudut antara vektor representasi dokumen.

Metode ini dapat digunakan untuk melihat skor kemiripan antara dua kalimat atau dokumen.

Nilai cosine similarity adalah antara 0 dan 1.

Semakin besar nilai cosine similarity, semakin mirip antara dua kalimat atau dokumen. Nilai cosine similarity 1 menyatakan kesamaan 100%, sedangkan jika nilai 0 berarti 100% tidak sama, dapat dilihat di persamaan 5.

𝐶𝑜𝑠𝑆𝑖𝑚 (𝑑_𝑗, 𝑞) ^𝑑^𝑗^∙𝑞

|𝑑_𝑗| |𝑞|

∑^𝑡_𝑖=1(𝑤_𝑖𝑗× 𝑤_𝑖𝑞)

√∑^𝑡_𝑖=1(𝑤_𝑖𝑗)² × √∑^𝑡_𝑖=1(𝑤_𝑖𝑞)²

(5) Keterangan :

D = dokumen Q = kata kunci

𝑤_𝑖𝑗 = bobot kata ke i pada dokumen j 𝑤_𝑖𝑞 = bobot kata ke i pada dokumen 2.9 Evaluasi

Evaluasi merupakan perbandingan kriteria dan standar agar dapat menghasilkan implementasi yang bagus. Evaluasi akan menjadi tolak ukur dari masalah rekomendai resep masakan agar menghitung nilai recall dan precision. Dari hasil nilai recall dan precision langkah selanjutnya menghitung threshold untuk membandingkan.

(Purwanti, 2015).

2.10 Threshold

Threshold merupakan nilai ambang batas yang berfungsi untuk menentukan tingkat kemiripan suatu query terhadap dokumen resep masakan. Jika nilai lebih besar atau sama dengan threshold maka dinyatakan relevan, namun jika dokumen bernilai lebih kecil dari threshold maka dinyatakan tidak relevan dengan dokumen lainnya. Hasil dari nilai ambang batas akan dilakukan data training untuk mendapatkan uji coba relevan (Anshori, 2010).

2.11 Precision Recall Relevansi

Penerapan prinsip relevansi merupakan mencari dokumen-dokumen yang relevan sesuai dengan masukan (query) dari pengguna.

Precision merupakan membandingkan jumlah dari dokumen yang relevan untuk mendapatkan query dengan jumlah dokumen yang terambil dari hasil pencarian (Purwanti, 2015).

𝑃𝑟𝑒𝑐𝑖𝑠𝑖𝑜𝑛 =𝐽𝑢𝑚𝑙𝑎ℎ 𝑑𝑜𝑘𝑢𝑚𝑒𝑛 𝑟𝑒𝑙𝑒𝑣𝑎𝑛 𝑡𝑒𝑟𝑎𝑚𝑏𝑖𝑙 𝐽𝑢𝑚𝑙𝑎ℎ 𝑠𝑒𝑙𝑢𝑟𝑢ℎ 𝑑𝑜𝑘𝑢𝑚𝑒𝑛 𝑡𝑒𝑟𝑎𝑚𝑏𝑖𝑙 (7) Recall merupakan membandingkan jumlah dokumen relevan yang telah terambil sesuai dengan query yang memberikan semua total kumpulan dokumen yang relevan dengan query (Purwanti, 2015).

𝑅𝑒𝑐𝑎𝑙𝑙 = 𝐽𝑢𝑚𝑙𝑎ℎ 𝑑𝑜𝑘𝑢𝑚𝑒𝑛 𝑟𝑒𝑙𝑒𝑣𝑎𝑛 𝑡𝑒𝑟𝑎𝑚𝑏𝑖𝑙 𝐽𝑢𝑚𝑙𝑎ℎ 𝑠𝑒𝑙𝑢𝑟𝑢ℎ 𝑑𝑜𝑘𝑢𝑚𝑒𝑛 𝑟𝑒𝑙𝑒𝑣𝑎𝑛 (8)

3 HASIL DAN PEMBAHASAN

(5)

Dalam tahap pengujian query akan dilakukan menggunakan metode N-Gram untuk mengetahui rekomendasi resep masakan terhadap query yang dimasukkan. Metode N- gram memiliki tiga macam proses yaitu unigram, bigram dan trigram.

3.1 Pengujian N-gram

Pengujian N-Gram ini dilakukan untuk mengetahui relevan atau tidak relevan dalam dokumen. Status dari relevan dan tidak relevan akan ditentukan oleh responden ibu rumah tangga. Jumlah data latih terdiri dari 100 resep masakan yang diambil dari https://cookpad.com.

Data uji sendiri adalah query yang dimasukan dalam kolom pencarian resep masakan..

3.1.1 Pengujian Query 1

Tabel 1 Daftar Query No Query

1 50 gram ayam, 1 ons brokoli, 8 buah jamur, 6 buah bakso, 5 buah sosis, 250 gram wortel, 1 siung bawang putih, 1 sdt saus tiram, 1 sdm tepung kanji, garam, lada, minyak goreng

Pengujain N-gram pada Query dilakukan menggunakan metode unigram. Pada Tabel 2 berikut query yang diujikan adalah “50 gram ayam, 1 ons brokoli, 8 buah jamur, 6 buah bakso, 5 buah sosis, 250 gram wortel, 1 siung bawang putih, 1 sdt saus tiram, 1 sdm tepung kanji, garam, lada, minyak goreng”.

Tabel 2 Pengujian Query Pada Unigram

Threshold

30% R/

T R

50% R/

T R

70% R/T

R

90% R/

T R Capcai

Brokoli

R Capcai Brokoli

R

Keterangan:

R = Relevan TR = Tidak Relevan

Dari hasil pengujian Tabel 2 memperoleh nilai cosine similarity nya ≥ threshold 30, 50, 70% dan 90% adalah yaitu Capcai brokoli. Menurut responden resep tersebut relevan karena sesuai yang diinginkan oleh responden ibu rumah tangga.

Tabel 3 Pengujian Query Pada Bigram

Threshold

30% R/

T R

50% R/

T R

70% R/

T R

90% R/

T R Capcai

Brokoli

R Capcai Brokoli

R - -

Keterangan:

Dari hasil pengujian Tabel 3 memperoleh nilai cosine similarity nya ≥ threshold 30, 50, dan 70% adalah yaitu Capcai brokoli. Menurut responden resep tersebut relevan karena sesuai yang diinginkan oleh responden ibu rumah tangga.

Tabel 4 Pengujian Query Pada Trigram

Threshold

30% R/

T R

50% R/

T R

70% R/

T R

90% R/

T R Capcai

Brokoli

R Capcai Brokoli

R - -

Keterangan:

Dari hasil pengujian Tabel 4 memperoleh nilai cosine similarity nya ≥ threshold 30, 50, dan 70% adalah yaitu Capcai brokoli. Menurut responden resep tersebut relevan karena sesuai yang diinginkan oleh responden ibu rumah tangga.

3.2 Pengujian Precision Recall Relevansi Pengujian precision dan recall untuk menentukan hasil dari metode N-Gram.

Bertujuan untuk mencari rekomendasi resep masakan dapat dilihat nilai precision dan recall.

Tabel 5 Hasil Pengujian Precision Recall

Unigram Bigram Trigram

(6)

T R P T R P T R P

30% 1 0,2 30% 1 0,2 30% 1 0,2 50% 1 0,2 50% 1 0,2 50% 1 0,2 70% 1 0,2 70% 1 0,2 70% 1 0.2 90% 1 0.2 90% - - 90% - -

Keterangan:

T = Threshold R = Recall P = Precision

Penjelasan hasil dari Tabel 5 adalah query

“50 gram ayam, 1 ons brokoli, 8 buah jamur, 6 buah bakso, 5 buah sosis, 250 gram wortel, 1 siung bawang putih, 1 sdt saus tiram, 1 sdm tepung kanji, garam, lada, minyak goreng”

dengan proses unigram didapatkan nilai recall 1 dan precision 0,2 pada threshold 30% sampai 90%. Pada pengujian proses bigram dan trigram menggunakan threshold 30%, 50% dan 70%

menghasilkan nilai recall dan precision yang sama. Nilai recall yang dihasilkan adalah 1 dan nilai precision yang dihasilkan adalah 0,2.

Pada pengujian selanjutnya akan melakukan perhitungan nilai ambang batas atau threshold dari query. Tabel 6 merupakan hasil penentuan sistem rekomendasi resep masakan.

Diantara ketiga proses untuk menguji query yaitu unigram, bigram, dan trigram yang paling cocok untuk digunakan batas nilai dalam menentukan hasil rekomendasi resep masakan yaitu proses unigram.

Tabel 6 Hasil Penentuan Threshold

N-Gram Threshold

30% 50% 70% 90%

Unigram √ √ √ √

Bigram √ √ √ -

Trigram √ √ √ -

3.1.1 Pengujian Query 2

Tabel 7 Daftar Query No Query

1 1 buah mie telur, 1 bawang merah, 6 siung bawang putih, 1 butir telur, 3 sdm kecap manis, 2 sdt kaldu jamur, 2 sdt gula pasir, 2 sdm gula merah, 1 sdt lada bubuk, 1 sdm minyak wijen, air

Pengujian N-gram pada Query dilakukan menggunakan metode unigram. Pada Tabel 8 berikut query yang diujikan adalah “1 buah mie telur, 1 bawang merah, 6 siung bawang putih, 1 butir telur, 3 sdm kecap manis, 2 sdt kaldu jamur, 2 sdt gula pasir, 2 sdm gula merah, 1 sdt lada bubuk, 1 sdm minyak wijen, air”.

Tabel 8 Pengujian Query Pada Unigram

Threshold

30% R/T

R

50% R/

T R

70% R/

T R

90

% R/

T R Mie

Goreng jamur kuping

R Mie

goreng jamur kuping

R Mie Goreng Jamur

R - -

Tiam mi R - - - - - -

Mie kuning goreng

TR - - - - - -

Sayur sup

TR - - - - - -

Keterangan:

Hasil dari pengujian Tabel 8 memperoleh hasil nilai dari cosine similarity yang lebih besar atau sama dengan threshold 30% adalah Mie goreng jamur kuping dan Tiam mi. Responden menyatakan bahwa bahan yang digunakan relevan sebab sudah sesuai dengan query yang dimasukkan didalam sistem. Pada resep masakan Mie kuning goreng dan sayur sup dinyatakan tidak relevan karena query tersebut tidak cocok dengan penilaian dari responden.

Nilai dari cosine similarity nya ≥ threshold 50%

dan 70% adalah Mie goreng jamur kuping.

Tabel 9 Pengujian Query Pada Bigram Threshold

30

% R/

TR 50

% R/

TR 70

%

R/

TR 90

% R/

TR

(7)

Tiam Mi

R Tiam Mi

R

- -

Keterangan:

Pengujian hasil Tabel 9 memperoleh nilai cosine similarity nya ≥ threshold 30%, 50% dan 70% adalah Tiam mi. Menurut responden resep masakan tersebut relevan karena cocok dengan query yang dimasukkan dalam sistem.

Tabel 10 Pengujian Query Pada Trigram Threshold

30

% R/

TR 50

% R/

TR 70

%

R/

TR 90

% R/

TR Tiam

Mi

R Tiam Mi

R

- -

Keterangan:

Dari hasil pengujian Tabel 10 akan menghasilkan resep masakan dengan nilai cosine similarity nya ≥ threshold 30%, 50% dan 70%

adalah Tiam mi. Menurut responden resep masakan tersebut relevan sebab cocok dengan query yang sebelumnya dimasukkan didalam sistem.

3.2 Pengujian Precision Recall Relevansi Pengujian precision dan recall untuk menentukan hasil dari metode N-Gram.

Bertujuan untuk mencari rekomendasi resep masakan dapat dilihat nilai precision dan recall.

Tabel 11 Hasil Pengujian Precision Recall

Unigram Bigram Trigram

T R P T R P T R P

30% 1 0.4 30% 1 0,2 30% 1 0,2 50% 1 0,2 50% 1 0,2 50% 1 0,2 70% 1 0,2 70% 1 0,2 70% 1 0,2

90% - - 90% - - 90% - -

Keterangan:

T = Threshold R = Recall

P = Precision

Penjelasan hasil dari Tabel 11 diatas adalah query “1 buah mie telur, 1 bawang merah, 6 siung bawang putih, 1 butir telur, 3 sdm kecap manis, 2 sdt kaldu jamur, 2 sdt gula pasir, 2 sdm gula merah, 1 sdt lada bubuk, 1 sdm minyak wijen, air” pada proses unigram mendapatkan nilai recall 1 dan precision 0,4 pada threshold 30%. Dan threshold 50% dan 70% didapatkan nilai recall 1 dan precision 0,2. Sedangkan proses bigram mendapatkan nilai yang sama.

Nilai recall yang dihasilkan adalah 1 dan precision yang dihasilkan 0,2.

Pengujian selanjutnya akan dilakukan dengan menghitung nilai threshold atau ambang batas dari query. Pada Tabel 12 dijelaskan bahwa diantara proses unigram, bigram, dan trigram pada pengujian query 1 ketiganya dinyatakan cocok untuk digunakan batasan nilai dalam menentukan rekomendasi resep masakan.

Tabel 12 Hasil Penentuan Threshold

N-Gram Threshold

30% 50% 70% 90%

Unigram √ √ √ - Bigram √ √ √ - Trigram √ √ √ -

4 KESIMPULAN

Kesimpulan dari hasil penelitian ini yaitu metode N-Gram dan Cosine Similarity berhasil diimplementasikan dalam menentukan rekomendasi resep masakan. Penelitian ini menggunakan 100 data latih yang terdiri dari 100 dokumen resep masakan serta data uji dalam bentuk query dibutuhkan oleh user sebagai bahan masakan tersedia yang akan diproses hingga menghasilkan keluaran berupa rekomendasi resep masakan. Terdapat beberapa tahap perhitungan sebelum memberikan keluaran berupa rekomendasi resep masakan yaitu 100 data resep masakan yang akan dilakukan pemrosesan menggunakan text preprocessing, pembobotan TF-IDF, normalisasi serta perhitungan cosine simalrity. Keluaran yang akan dihasilkan yaitu dalam bentuk rekomendasi resep masakan.

Hasil evaluasi dari pengujian menggunakan metode N-Gram dan Cosine Similarity menghasilkan proses trigram sebagai yang terbaik diantara ketiga metode unigram, bigram,

(8)

dan trigram. Hal tersebut dikarenakan nilai threshold yang dihasilkan yaitu ≥ 90% dan recall bernilai 0,2 serta nilai precission yaitu 1.

Perbedaan dari tiga proses unigram, bigram, dan trigram adalah proses unigram melakukan pemecahan query menjadi per 1 bagian kata, proses bigram melakukan pemecahan query menjadi per 2 bagian kata, dan proses trigram melakukan pemecahan query menjadi per 3 bagian kata.

Beberapa saran yang bisa diimplementasikan dalam penelitian ini yaitu pembentukan kata yang diproses menggunakan metode N-Gram akan lebih baik jika dilakukan perbaikan untuk menghasilkan nilai evaluasi yang lebih baik, sebab dalam pembentukan kata menggunakan metode N-Gram hasil yang diberikan masih kurang baik. Selain itu penerapkan kategori atau jenis resep masakan terhadap data latih juga diperlukan untuk memudahkan dalam menyeleksi dokumen resep masakan yang direkomendasikan.

5 DAFTAR PUSTAKA

Anshori, A.F 2010. Model Pencarian Hadits Yang Relevan Menggunakan Metode Cosine Similarity. Universitas Muhammadiyah Jember

Even, Yahir dan Zohar. 2002. Introduction to text mining. Automeated Learning Group National Center For Supercomputing Aplications. University of Illions.

Jannach, D., Zanker, M., Felfernig, A., &

Friedrich, G. (2010), Recommender systems: an introduction. Cambridge University Press

Nathania, D.Z. Indriati. Bachtiar, F.A.

Klasifikasi Spam Pada Twitter Menggunakan Metode Improved K- Nearest Neighbor. Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer e-ISSN: 2548-964X Vol. 2, No. 10, Oktober 2018, hlm. 3948-3956. Fakultas Ilmu Komputer, Universitas Brawijaya, Malang.

Permadi, Y. 2008. Kategorisasi Teks Menggunakan N-gram Untuk Dokumen Bahasa Indonesia. Institut Pertanian Bogor.

Purwanti, E. 2015. Klasifikafi Dokumen Temu Kembali Informasi dengan K-Nearest Neghbour. Universitas Airlangga Surabaya.

Robertson, Stephen. 2005. Understanding

Inverse Document Frequency: On theoretical arguments for IDF, England : Journal of Documentation, Vol. 60, pp.

502–520

Triana et al., 2016. pemanfaatan metode vector space model dan metode cosine similarity pada fitur deteksi hama dan penyakit tanaman padi. Surakarta: Informatika Surakarta.