commit to user
i
PENERAPAN KOMBINASI ALGORITMA
MINHASH
DAN
BINARY HAMMING DISTANCE
PADA
HYBRID
PEREKOMENDASI LAGU
SKRIPSI
Diajukan untuk memenuhi salah satu syarat mencapai gelar Strata Satu
Jurusan Informatika
Disusun Oleh :
LUTVI SATRIYO PUTRO
M0509043
JURUSAN INFORMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS SEBELAS MARET
SURAKARTA
commit to user
commit to user
commit to user
iv
MOTTO
Man Jadda, Wa Jadda!
( Negeri 5 Menara )
Man Shobaro, Zhafira! ( Ranah 3 Warna )
Man Saara ala Darbi Washala
( Rantau 1 Muara )
Hidup itu Perjuangan, anda hidup, anda berjuang
commit to user
v
PERSEMBAHAN
Saya persembahkan Karya Ini pada :
commit to user
vi
KATA PENGANTAR
Assalamu’alaikum Wr.Wb.
Puji syukur penulis panjatkan kehadirat Allah SWT Ya Rahman, Ya
Rahhim karena atas limpahan rahmat dan hidayah-Nya penulis dapat
menyelesaikan skripsi untuk menyelesaikan pendidikan strata satu Jurusan
Informatika UNS yang berjudul ”Penerapan Kombinasi Algoritma Minhash dan
Binary Hamming Distance pada Hybrid Perekomendasi Lagu”. Shalawat serta
salam senantiasa tercurah kepada Baginda Rasulullah Muhammad SAW, yang
dengan perantaraan dan perjuangan beliaulah, manusia kini berada di zaman yang
penuh dengan ilmu pengetahuan.
Di dalam penyusunan skripsi ini, penulis menyadari sepenuhnya bahwa
isinya sangat sederhana bahkan dapat dikatakan jauh dari sempurna untuk disebut
sebagai tulisan yang berbobot ilmiah. Namun bagi penulis hal itu sudah
merupakan pengerahan tenaga dan pikiran semaksimal mungkin.
Keberhasilan dalam penyusunan skripsi ini tidak terlepas dari bantuan
beberapa pihak. Maka dari itu, dengan segenap hati penulis tidak lupa
mengucapkan terima kasih yang sedalam – dalamnya kepada :
1. AllAh SWT, Tuhan semesta alam, penguasa langit dan bumi yang
selalu memberikan nikmat berupa kesehatan kepada penulis sehingga
penulis dapat menyelesaikan karya tulis,
2. Ibu Umi Salamah, S.Si., M.Kom. selaku Ketua Jurusan Informatika
FMIPA UNS,
3. Bapak Ristu Saptono, S.Si., M.T. dan Bapak Drs. Bambang Harjito,
M.App.Sc. selaku pembimbing I dan penguji yang telah memberikan
banyak bimbingan, pengarahan, dan motivasi kepada penulis selama
commit to user
vii
4. Ibu Rini Anggrainingsih, S.T., M.T. selaku Pembimbing Akademik dan
pembimbing II yang telah banyak memberi bimbingan dan pengarahan
akademik selama penulis menempuh studi di Jurusan Informatika
FMIPA UNS,
5. Bapak dan Ibu dosen Jurusan Informatika FMIPA UNS yang telah
memberikan pengajaran kepada penulis selama masa studi dan
membantu dalam proses penyusunan skripsi ini,
6. Ibu Erni Kusminingsih yakni ibu penulis yang telah memelihara dan
merawat penulis sejak kecil hingga dewasa ini dan telah memberikan
dorongan materiil maupun spiritual selama penyusunan skripsi ini,
7. Bapak Sri Desto Untung Raharjo yakni ayah penulis yang telah
mendukung bail materiil ataupun spiritual dan memberi semangat
penulis dari awal pengerjaan skripsi hingga sripsi ini selesai,
8. Rahmadani Eva Rosari yang tidak pernah lelah untuk selalu
memberikan semangat dan dorongan moral kepada penulis selama
penyusunan skripsi,
9. Teman-teman sejawat Informatika 2009 yang telah memberikan
kehangatan, kebersamaan dan kenangan selama menempuh studi di
Jurusan Informatika UNS,
10.Semua pihak yang telah membantu dalam penyelesaian penulisan karya
tulis ini yang tidak mungkin penulis sebutkan satu persatu.
Semoga skripsi ini dapat memberikan manfaat bagi pembaca pada untuk
dijadikan sebagai sebuah sumber inspirasi dan referensi dalam mengembangkan
ilmu pengetahuan terutama di bidang informatika demi tercapainya Indonesia
yang bermartabat dan berkepribadian luhur.
Wassalamu’alaikum Wr.Wb.
Surakarta, 13 Maret 2014
commit to user
commit to user
ix
PENERAPAN KOMBINASI ALGORITMA MINHASH DAN BINARY
HAMMING DISTANCE PADA HYBRID PEREKOMENDASI LAGU
LUTVI SATRIYO PUTRO
Jurusan Informatika. Fakultas MIPA. Universitas Sebelas Maret
ABSTRAK
Teknik yang biasanya digunakan untuk menghasilkan rekomendasi
adalah content-based, social-based dan hybrid. Content-based dan social-based
adalah teknik rekomendasi yang berdiri sendiri, sedangkan hybrid adalah
kombinasi dari beberapa teknik rekomendasi, seperti kombinasi knowledge-based
dan social-based pada aplikasi EntreeC dan kombinasi social-based dan content
-based pada DailyLearner.. Teknik hybrid menghasilkan rekomendasi yang lebih
baik daripada teknik rekomendasi yang berdiri sendiri, seperti meningkatkan akurasi rekomendasi dan mempercepatan produksi rekomendasi. Akan tetapi,
berdasarkan penelitian sebelumnya, hybrid social-based dan content-based yang
diterapkan pada data lagu, tidak menghasilkan rekomendasi yang lebih baik. Oleh
karena itu, pada penelitian ini kombinasi social-based dan content-based yang
diterapkan pada data lagu akan dikombinasikan dengan strategi switching,mixed,
dan cascade yang diharapkan mampu menghasilkan keluaran yang lebih baik.
Algoritma yang dipakai untuk mewakili social-based adalah minhash
association rules. Minhash association rules dipilih, karena algoritma ini baik
digunakan untuk data yang memiliki nilai sparsity tinggi. Algoritma yang
mewakili content-based adalah binary hamming distance. Binary hamming
distance dipilih untuk mempercepat proses pencarian. Fokus dari penelitian ini
adalah akurasi yang dihasilkan hybrid yang menggabungkan social-based dengan
content-based.
Hasil dari penelitian ini, hybrid yang menggunakan strategi switching,
cascade, dan mixed mampu membuat rekomendasi yang nilai akurasinya melebihi
rekomendasi yang dihasilkan social-based dan content-based murni pada data
yang memiliki nilai sparsity 0.94. Hal ini dibuktikan dengan nilai rata-rata akurasi
hybrid yang mencapai 0,48, nilai minhash 0,17 dan nilai hamming 0,42.
Sedangkan untuk data yang memiliki nilai sparsity 0,96, algoritma ini nilai
akurasinya dibawah algoritma binary hamming distance. Hal ini dibuktikan
dengan nilai rata-rata akurasi hybrid 0,4, nilai minhash 0,06 dan nilai binary
hamming distance 0,41.
commit to user
x
UTILIZATION OF COMBINATION MINHASH AND BINARY HAMMING
DISTANCE ALGORITHM FOR HYBRID SONG RECOMMENDATION
LUTVI SATRIYO PUTRO
Department of Informatic. Mathematic and Science Faculty.
Sebelas Maret University
ABSTRACT
Three techniques are commonly used to provide a recommendation i.e, content-based, social-based and hybrid. Content-based and social-based are stand-alone techniques, whereas hybrid is combination of several techniques such as combination of knowledge and social-based at EntreeC and combination of social and content-based at DailyLearner. Hybrid technique generally generates a better recommendation than content-based and social-based such as increase
recommendation’s accuracy and speed up recommendation’s production.
However, hybrid social-based and content-based, applied to song data, do not produce a better recommendation. Therefore, in this research, social - based and content-based will be combined by switching, mixing, and cascade strategy in order to get better output.
The algorithm used to represent social-based is minhash association rules. These association rules are chosen, because the rules can be used for collecting data which high sparsity. The algorithm used to represent content-based is binary hamming distance. The hamming distance is chosen for speeding up the search process. The objective of this research is accuracy that produced by hybrid that combines social-based and content-based.
The result of this research, hybrid that used switching, cascade and mixed produce better accuracy recommendation than social-based and content-based on data that have sparsity value 0.94. This is evidenced by the average accuracy value of hybrid reaches 0.48, minhash accuracy reaches 0.17 and hamming reaches 0.42. as for the data that have sparsity value 0.96, hybrid algorithm accuracy below binary hamming distance. This is evidenced by average accuracy value of hybrid reaches 0.4, minhash 0.06 and binary hamming distance 0.41.
Keywords: Binary Hamming Distance, Content-based, Minhash, Social-based
commit to user
xi
DAFTAR ISI
HALAMAN JUDUL ... i
HALAMAN PERSETUJUAN ... ii
HALAMAN PENGESAHAN ... iii
MOTTO ... iv
PERSEMBAHAN ... v
KATA PENGANTAR ... vi
ABSTRAK ... ix
ABSTRACT ... x
DAFTAR ISI ... xi
DAFTAR TABEL ... xiii
DAFTAR GAMBAR ... xiv
BAB I PENDAHULUAN ... 1
1.6 SISTEMATIKA PENULISAN ... 5
BAB II TINJAUAN PUSTAKA ... 6
2.1 LANDASAN TEORI ... 6
2.1.1 Social-based ... 6
2.1.2 Content-based ... 7
2.1.3 Hybrid ... 9
2.1.4 Algoritma Minhash ... 10
2.1.5 Algoritma Binary Hamming Distance ... 12
2.2 PENELITIAN TERKAIT ... 15
2.3 HIPOTESA ... 18
2.4 KERANGKA PEMIKIRAN ... 18
BAB III METODOLOGI PENELITIAN... 20
3.1 PEMODELAN DATA ... 20
commit to user
xii
3.3 PENGUJIAN DAN ANALISA HASIL ... 25
BAB IV HASIL DAN PEMBAHASAN ... 26
4.1 PEMODELAN DATA ... 26
4.2 PENERAPAN ALGORITMA ... 28
4.2.1 Switching ... 28
4.2.2 Mixed ... 29
4.2.3 Cascade... 29
4.3 PENGUJIAN ... 31
BAB V KESIMPULAN DAN SARAN ... 35
5.1 KESIMPULAN ... 35
5.2 SARAN ... 36
commit to user
xiii
DAFTAR TABEL
Tabel 2.1.2.1 Kelebihan dan Kelemahan Masing-masing Teknik ... 9
Tabel 2.1.5.2.1 tabel perbandingan kata ... 13
Tabel 2.1.5.2.2 tabel perbandingan biner ... 14
Tabel 2.3 Tabel keterkaitan penelitian dengan penelitian sebelumnya... 19
Tabel 4.1.1 Contoh Transaksi ... 26
Tabel 4.1.2 Contoh Rule ... 26
Tabel 4.1.3 Penyederhanaan Rule ... 27
Tabel 4.1.4 Rule dengan nilai confidence ... 27
Tabel 4.1.5 Rule hasil penyaringan confidence ... 27
Tabel 4.2.1.1 Contoh daftar lagu ... 28
Tabel 4.2.3.1 Contoh tabel Rule... 30
Tabel 4.3.1 Hasil Pengujian Training Set 75% ... 31
commit to user
xiv
DAFTAR GAMBAR
Gambar 3.1 Diagram alir metodologi penelitian... 20
Gambar 3.2 Diagram alir Pemodelan Data ... 20
Gambar 3.3 Diagram Alir Switching dan Mixed ... 23
Gambar 3.4 Diagram Alir Cascade ... 24
Gambar 3.5 Diagram Alir Penerapan Algoritma ... 24
Gambar 4.3.1 Pengujian Akurasi dengan Training Set 75% ... 32