• Tidak ada hasil yang ditemukan

Pembangunan Program Mesin Rekomendasi Judul Manga dengan Penerapan Teknik Clustering.

N/A
N/A
Protected

Academic year: 2017

Membagikan "Pembangunan Program Mesin Rekomendasi Judul Manga dengan Penerapan Teknik Clustering."

Copied!
17
0
0

Teks penuh

(1)

4.

ABSTRAK

Manga adalah istilah untuk buku komik dari Jepang yang memiliki banyak

penggemar, bukan hanya berasal dari Jepang saja, melainkan dari berbagai negara lain. Saat ini jumlah manga yang beredar sangatlah banyak, sehingga para penggemar manga terkadang kebingungan untuk mencari judul yang cocok dengan selera mereka. Hal ini juga dipersulit dengan fakta bahwa tidak semua

manga yang beredar di Jepang diterjemahkan dan diterbitkan juga di negara lain

terutama Indonesia. Jadi, salah satu cara penggemar manga mengakses judul

manga adalah melalui web. Tetapi pengaksesan melalui web dimana manga

dikelompokkan berdasarkan genre yang diberikan secara manual saja tidak cukup untuk membantu penggemar manga menentukan judul yang sesuai dengan selera mereka. Ini dikarenakan salah satu pertimbangan penggemar manga untuk membaca suatu judul adalah kemiripan alur cerita ataupun unsur cerita dan penokohan dengan manga yang disukainya. Program yang dapat memberikan rekomendasi yang dapat memenuhi kebutuhan penggemar manga tersebut akan sangan membantu. Untuk itu diperlukan suatu metode yang cocok untuk mengelompokkan manga berdasarkan unsur cerita. Unsur cerita dapat diakses melalui sinopsis manga. Metode tersebut adalah clustering yang dapat mengelompokkan objek berdasarkan kemiripan konten dari objek tersebut . Untuk mendukung jalannya proses clustering, dibutuhkan sumber data yang tepat.

Myanimelist.com dapat menjadi sumber data yang cukup baik. Setelah dilakukan

percobaan, pemberian rekomendasi berdasarkan data hasil clustering masih dianggap kurang memenuhi kebutuhan. Hal ini disebabkan oleh masih rendahnya tingkat akurasi yang diberikan oleh Program, yakni 45%.

(2)

5.

ABSTRACT

Manga is the term for comic books from Japan which has a lot of fans, not only from Japan alone, but from many other countries. The current number of outstanding manga is very much, so that the fans of manga sometimes confused to find a title that matches their tastes. It is also complicated by the fact that not all manga that circulating in the Japan were translated and published in other countries, especially Indonesia. So, one of the waya manga’s fan can access the manga titles is through the web. But accesing the web where manga grouped by genre which is given manualy is not enough to help manga’s fan determine manga titles according to their tastes. This is because one of the reasons fans of manga read a title is its semblance of plot or story elements and characterizations with his favorite manga. Program that can provide recommendations which can meet the needs of fans of the manga will be unbelievably helpful. For that we need a suitable method to classify manga based on the story elements. Story elements can be accessed through the manga’s synopsis. The clustering method is grouped objects based on similarity content of the object. To support the course of the clustering process, it takes appropriate data sources. Myanimelist.com can be a pretty good source of data. After the trial, giving recommendations based on the data clustering results are still considered less to meet the needs. It is caused by low levels of accuracy provided by the application, namely 45%.

(3)

DAFTAR ISI

LEMBAR PENGESAHAN ... ii

PERNYATAAN ORISINALITAS LAPORAN PENELITIAN ... iii

PERNYATAAN PUBLIKASI LAPORAN PENELITIAN ... iv

PRAKATA ... v

ABSTRAK ... vi

ABSTRACT ... vii

DAFTAR ISI ... viii

DAFTAR GAMBAR ... xii

DAFTAR TABEL ... xiv

DAFTAR RUMUS ... xv

DAFTAR SIMBOL ... xvi

BAB I PENDAHULUAN ... 1

1.1 Latar Belakang Masalah ... 1

1.2 Rumusan Masalah... 2

1.3 Tujuan Pembahasan ... 2

1.4 Batasan Masalah ... 2

1.5 Sistematika Penyajian ... 3

BAB II LANDASAN TEORI ... 4

2.1 Temu Balik Informasi (Information Retrieval) ... 4

2.2 Recommendation System ... 4

2.3 Search Engine ... 4

2.3.1 Indexing Process ... 5

2.3.2 Query process... 6

(4)

2.4 Data Mining ... 9

2.5 Clustering ... 11

2.5.1 Euclidean Distance ... 11

2.5.2 Manhattan Distance ... 12

2.6 K-Means... 12

2.7 Manga ... 13

BAB III ANALISIS DAN DESAIN ... 14

3.1 Analisis ... 14

3.2 Gambaran Keseluruhan ... 14

3.2.1 Antarmuka Perangkat Keras ... 15

3.2.2 Antarmuka Perangkat Lunak... 16

3.2.3 Fitur-Fitur Produk Perangkat Lunak ... 16

3.3 Desain ... 19

3.3.1 Pra-pengolahan Data ... 20

3.3.2 Use Case Diagram... 22

3.3.3 Deskripsi Use Case Diagram ... 22

3.4 Flowchart Program ... 23

3.5 Activity Diagram... 26

3.5.1 Clustering ... 26

3.5.2 Permintaan Rekomendasi ... 26

3.6 Desain Antar Muka ... 27

3.6.1 Jendela Permintaan Rekomendasi Pengguna ... 28

3.6.2 Jendela Pengolahan Data... 28

BAB IV PENGEMBANGAN PERANGKAT LUNAK ... 30

4.1 Pengolahan Data ... 30

(5)

4.3 Implementasi Vector Space Model ... 32

4.4 Implementasi Pembobotan ... 32

4.5 Implementasi Class ... 33

4.5.1 Class Manga ... 34

4.5.2 Class Centroid ... 34

4.5.3 Class DocCollection ... 35

4.5.4 Class DokumenVektor ... 35

4.5.5 Class Similarity ... 36

4.5.6 Class VectorSpaceMod ... 36

4.5.7 Class DocClustering ... 38

4.5.8 Class Author ... 39

4.5.9 Class AuthorPoint ... 40

4.5.10 Class AuthorCentroid ... 40

4.5.11 Class Genres ... 41

4.5.12 Class FCM ... 42

4.5.13 Class Core ... 43

4.6 Implementasi Penyimpanan Data ... 44

4.6.1 Data Manga ... 44

4.6.2 Data Hasil Clustering Pengarang ... 46

4.7 Implementasi Antar Muka Pengguna ... 46

4.7.1 Jendela Pengaturan ... 46

4.7.2 Jendela Permintaan Rekomendasi ... 47

BAB V TESTING DAN EVALUASI ... 49

5.1 Rencana Pengujian Rekomendasi ... 49

5.2 Pengujian Rekomendasi ... 49

(6)

5.2.2 Test Case J-02 ... 51

5.2.3 Test Case J-03 ... 53

5.2.4 Test Case J-04 ... 54

5.2.5 Test Case J-05 ... 55

5.2.6 Test Case J-06 ... 57

5.2.7 Test Case J-07 ... 58

5.3 Kesimpulan Hasil Pengujian Rekomendasi ... 60

5.4 Rencana Pengujian Fungsionalitas Program ... 60

5.5 Pengujian Fungsionalitas ... 60

5.6 Kesimpulan Hasil Pengujian Fungsionalitas Program ... 61

BAB VI KESIMPULAN DAN SARAN ... 62

6.1 Kesimpulan ... 62

6.2 Saran ... 63

DAFTAR PUSTAKA ... 64

(7)

DAFTAR GAMBAR

Gambar 2.1 Vector Space Model (Han, 2012) ... 7

Gambar 3.1 Flow Chart Metode Kerja ... 15

Gambar 3.2 Contoh Data Acuan ... 20

Gambar 3.3 Sinopsis sebelum dilakukan stopping ... 21

Gambar 3.4 Sinopsis setelah melalui proses stopping ... 20

Gambar 3.5 Use Case Diagram ... 22

Gambar 3.6 Flowchart Menu Kelola Data ... 24

Gambar 3.7 Flowchart Menu Rekomendasi ... 25

Gambar 3.8 Activity Diagram Clustering ... 26

Gambar 3.9 Activity Diagram Permintaan Rekomendasi ... 27

Gambar 3.10 Tampilan Jendela Pengguna ... 28

Gambar 3.11 Jendela Ekspert ... 29

Gambar 4.1 Pseudocode ClusteringK-Means ... 32

Gambar 4.2 Class Diagram... 33

Gambar 4.3 Class Manga ... 34

Gambar 4.4 Class Sentroid ... 35

Gambar 4.5 Class DocCollection ... 35

Gambar 4.6 Class DokumenVektor ... 35

Gambar 4.7 Class Similarity ... 36

Gambar 4.8 Class VectorSpaceMod ... 37

Gambar 4.9 Class DocClustering ... 39

Gambar 4.10 Class Author ... 39

Gambar 4.11 Class AuthorPoint ... 40

Gambar 4.12 Class AuthorCentroid ... 41

Gambar 4.13 Class Genres ... 42

Gambar 4.14 Class FCM ... 43

Gambar 4.15 Tampilan Data .csv ... 44

Gambar 4.16 Tampilan Data .txt ... 46

Gambar 4.17 Form Manage Data ... 47

(8)

Gambar 5.1 Hasil Rekomendasi Ao no Exorcist ... 50

Gambar 5.2 Rekomendasi web Ao no Exorcist ... 51

Gambar 5.3 Hasil Rekomendasi D Gray Man ... 52

Gambar 5.4 Rekomendasi web D Gray Man ... 52

Gambar 5.5 Hasil Rekomendasi Harigane Service ... 53

Gambar 5.6 Rekomendasi web Harigane Service ... 54

Gambar 5.7 Hasil Rekomendasi Katekyo Hitman Reborn ... 54

Gambar 5.8 Rekomendasi web Katekyo Hitman Reborn ... 55

Gambar 5.9 Hasil Rekomendasi Reimei no Arcana... 56

Gambar 5.10 Rekomendasi web Reimei no Arcana ... 56

Gambar 5.11 Hasil Rekomendasi 666 Satan ... 57

Gambar 5.12 Rekomendasi web 666 Satan... 58

Gambar 5.13 Hasil Rekomendasi Tennis no Ouji-sama ... 59

(9)

DAFTAR TABEL

Tabel 3.1 Contoh Stop Word ... 21

Tabel 3.2 Skenario use case Meminta Rekomendasi ... 23

Tabel 3.3 Skenario use case Mengelola Data ... 23

Tabel 3.4 Skenario use case Mengelola Cluster Pengarang ... 23

Tabel 4.1 Contoh Data .csv ... 45

Tabel 5.1 Data manga Ao no Exorcist ... 50

Tabel 5.2 Data manga D Gray Man ... 51

Tabel 5.3 Data manga Harigane Service ... 53

Tabel 5.4 Data manga Katekyo Hitman Reborn ... 54

Tabel 5.5 Data manga Reimei no Arcana ... 55

Tabel 5.6 Data manga 666 Satan... 57

Tabel 5.7 Data manga Tennis no Ouji-sama ... 58

Tabel 5.8 Test Case Pengujian Fungsionalitas ... 60

Tabel 5.9 Test Case Pengecekan Data Acuan Rekomendasi ... 61

(10)

DAFTAR RUMUS

Rumus 2.1 Rumus Similarity Cosine (Deza, 2009) ... 8

Rumus 2.2 Rumus TFIDF (Deza, 2009) ... 8

Rumus 2.3 Rumus TF Normalisasi (Deza, 2009) ... 8

Rumus 2.4 Rumus IDF (Deza, 2009) ... 9

(11)

DAFTAR SIMBOL

Use Case Diagram (UML 2.0)

No Gambar Keterangan

1. Menggambarkan aktor atau pengguna

Program.

2. Menggambarkan proses atau aksi yang dapat

dilakukan oleh aktor pada Program.

3. Menggambarkan sistem tempat proses

(12)

6.

BAB I

PENDAHULUAN

1.1

Latar Belakang Masalah

Manga adalah istilah untuk buku komik dari Jepang yang memiliki

banyak penggemar, bukan hanya berasal dari Jepang saja, melainkan dari berbagai negara lain. Hal ini merupakan dampak populernya budaya Jepang di banyak negara serta adanya kerja sama antara penerbit manga di Jepang dengan penerbit di negara-negara lain untuk menerjemahkan dan menerbitkan manga. Selayaknya buku pada umumnya, manga pun memiliki banyak genre, antara lain shoujo atau komik remaja wanita, shounen atau komik remaja pria, sport, comedy, horror, dan

slice-of life.

Seiring dengan pertumbuhan industri manga, jumlah judul manga yang beredar sangatlah banyak. Terbukti dengan survey pada 10 kota di kawasan Asia Timur saja, manga menguasai lebih dari 50% pasaran komik di Taiwan dan Hongkong, sedangkan komik Barat memiliki kurang dari 11%. Riset ini berdasarkan Hokuhodo, sebuah badan periklanan di Jepang (Syed, 2011). Jumlah yang banyak ini menyebabkan banyak penikmat manga kebingungan dalam menentukan judul yang akan dibacanya. Hal ini juga dipersulit dengan fakta bahwa tidak semua manga yang beredar di Jepang diterjemahkan dan diterbitkan juga di negara lain. Jadi, salah satu cara penggemar manga mengakses judul yang hendak dibacanya adalah melalui web misalnya myanimelist.com.

Tetapi pengaksesan melalui web ini hanya memperbanyak pilihan judul yang dapat dipilih penggemar manga, bukan membantu penggemar manga memilih judul yang sesuai dengan preferensi genre masing-masing penggemar. Melihat masalah tersebut, penelitian ini akan menyusun suatu Program yang dapat memberikan masukan atau rekomendasi judul kepada penggemar manga. Program ini akan mengakses data manga secara offline sebagai referensi rekomendasi

manga yang akan disarankan kepada pengguna.

(13)

2

rekomendasi. Fitur-fitur yang dapat diekstrak dari masukan pengguna antara lain Judul manga, pengarang, dan nilai rating yang dimiliki oleh manga.

1.2

Rumusan Masalah

Berdasarkan latar belakang masalah pada bagian 1.1, maka dirumuskan masalah sebagai berikut :

1. Bagaimana teknik pengumpulan data sebagai acuan rekomendasi manga. 2. Pre-precossing apa saja yang akan digunakan pada sinopsis manga.

3. Bagaimana menggunakan hasil pengolahan data acuan manga untuk menghasilkan rekomendasi.

1.3

Tujuan Pembahasan

Berdasarkan rumusan masalah pada bagian 1.2 terdapat beberapa tujuan pembahasan sebagai berikut :

1. Data dikumpulkan secara semi-manual menggunakan web scraper.

2. Sinopsis pada data manga akan diolah untuk menghilangkan stopword dan menyisakan token untuk selanjutnya diolah menjadi model vektor.

3. Data acuan akan diolah, selanjutnya parameter masukan pengguna akan dibuat sebagai acuan untuk pemberian rekomendasi.

1.4

Batasan Masalah

Dalam pembuatan Program ini, akan ditentukan batasan masalah sebagai berikut:

1. Program rekomendasi berbasis desktop.

2. Data manga yang digunakan bersumber dari myanimelist.com.

(14)

3

1.5

Sistematika Penyajian

Sistematika laporan yang dipergunakan dalam tugas akhir ini adalah: BAB I PENDAHULUAN

Bab ini berisi tentang pendahuluan yang terdiri dari latar belakang, rumusan masalah, tujuan pembahasan, batasan masalah, serta sistematika penyajian dari proyek kerja praktek ini.

BAB II LANDASAN TEORI

Bab ini membahas teori-teori yang berkaitan dalam penyelesaian proyek kerja praktek ini.

BAB III ANALISIS DAN DESAIN

Bab ini membahas secara lengkap mengenai pemodelan dan diagram alir sistem kerja dari Program, perancangan desain Program, dan penjelasan sistem. BAB IV PENGEMBANGAN PERANGKAT LUNAK

Bab ini berisikan tentang hasil yang telah dicapai lewat Program. BAB V TESTING DAN EVALUASI SISTEM

Bab ini berisi pengujian dan analisa terhadap masing-masing fungsi dari Program.Laporan dari pengujian tiap fungsi / method yang dibuat dalam metode

blackbox testing.

BAB VI KESIMPULAN DAN SARAN

(15)

11.

BAB VI

KESIMPULAN DAN SARAN

6.1

Kesimpulan

Kesimpulan yang didapat dari hasil analisis, pembuatan Program, dan uji coba adalah sebagai berikut:

1. Untuk membangun Program mesin rekomendasi manga, dibutuhkan data-data manga yang lengkap. Data-data-data berupa judul, sinopsis, dan genre dibutuhkan untuk menghitung kemiripan antar manga. Data tersebut dapat diambil dari situs yang memuat informasi tentang manga, seperti

myanimelist.com. Dari hasil pembuatan Program dan uji coba pemilihan myanimelist.com sebagai sumber data sudah cukup baik.

2. Hasil clustering manga berdasarkan sinopsis menggunakan K-Mean sudah cukup baik. Program sudah dapat memberikan bobot pada manga berdasarkan sinopsisnya untuk kemudian dikelompokkan berdasarkan kemiripan. Hanya saja, ukuran dataset yang digunakan untuk proses clustering mempengaruhi akurasi dari hasil clustering.

3. Hasil clustering pengarang berdasarkan genre menggunakan FCM dirasa belum cukup baik. Hal ini berdasarkan hasil akurasi dari rekomendasi yang dihasilkan oleh Program tidak dapat mencapai angka lebih dari 50%. 4. Cluster yang dihasilkan sudah menyamai data genre yang dijadikan bahan

acuan, hanya saja rekomendasi pada website myanimelist.com yang juga digunakan sebagai data pembanding jauh lebih akurat. Hal ini dikarenakan rekomendasi pada website tersebut didasarkan oleh rekomendasi dari pengguna yang telah membaca dan memberi review terhadap judul manga tersebut.

(16)

6.2

Saran

Beberapa saran untuk pengembangan Program ini:

1. Modul web scrapper dapat ditambahkan kedalam Program sehingga proses manage data dapat dilakukan secara online.

(17)

64

12.

DAFTAR PUSTAKA

C.D. Maning, P. R. (2009). An Introduction to Information Retrieval. Cambridge: Cambridge University Press.

Deza, M. M. (2009). Encyclopedia of Distance. Berlin: Springer-Verlag.

Francesco Ricci, L. R. (2010). Introduction to Recommender System Handbook.

Jain, A. K. (1999). Data Clustering: a review. ACM Computing Surveys (CSUR), 264-323.

Kantardzic, M. (2003). Data Mining, Concepts, Models, Methods, and

Algorithms. IEEE Press.

Kusnawi. (2007). Pengantar Solusi Data Mining. Seminar Teknologi Nasional, 1-5.

Lent, J. A. (2001). Illustrating Asia: Comics, Humor Magazines, and Picture

Books. Honolulu: University of Hawaii Press.

Merriam-Webster Online Dictionary. (n.d.). Manga. Retrieved 5 29, 2015, from Merriam-Webster Online Dictionary: http://www.merriam-webster.com/dictionary/manga

Sergey Brin, L. P. (2000). The Anatomy of a Large-Scale Hypertext Web Search

Engine. Stanford: Stanford University.

Gambar

Gambar Keterangan

Referensi

Dokumen terkait

Pengaruh kejadian La Nina terhadap curah hujan di Indonesia selama bulan Juli 1998 lebih luas di banding bulan Juni 1998 dimana selama bulan Juli 1998 efek La Nina mulai bergerak

Peneliti melihat ada beberapa cara yang di lakukan oleh orang tua di Dusun Candi Rejo dalam membangun dan menerapkan peran pendidikan keluarga kepada anak-anak nya dalam

Hasil penelitian ini yaitu telah dikembangkan model permainan berbasis bola voli untuk meningkatkan keterampilan multilateral siswa sekolah dasar kelas atas yang berbentuk

Melihat pentingnya kemampuan motorik dan perseptual motorik peserta didik sebagai modal awal untuk menyalurkan bakat sepakbola melalui kegiatan ekstrakurikuler sepakbola, maka

Pada analisa kondisi lingkungan kampung keputih tegal timur, ditemukan beberapa aspek yang menunjukkan kurang memadainya fasilitas dan infrastruktur kampung,

Penelitian ini menunjukkan bahwa pengaruh waktu tunda pada model epidemik SEIR hanya mempengaruhi konvergensi dari kestabilan tiap titik keseimbangan dan tidak mempengaruhi

bukti yang menunjukkan tanaman ini telah ditanam oleh masyarakat dalam ditanam oleh masyarakat dalam kerajaan ini adalah berdasarkan jumpaan sekam dan bijian padi di beberapa

Tunas-tunas yang terbentuk tersebut berwarna hijau dengan pertumbuhan sempurna (Gambar 3), sedangkan pada eksplan kalus embrionik hasil persilangan antara jeruk siem x