PROPOSAL PENELITIAN PASCASARJANA (PPASCA) DANA ITS TAHUN 2020

(1)

PROPOSAL

PENELITIAN PASCASARJANA (PPASCA)

DANA ITS TAHUN 2020

Pembangkitan Data Spam untuk Review Produk berdasarkan

Fitur Urutan dan Makna Kata dengan Arsitektur Deep Learning

Tim Peneliti:

Dr. Diana Purwitasari, S.Kom., M.Sc. (T. Informatika/ FTEIC)

Dr. Eng. Chastine Fatichah, S.Kom., M.Kom. (T. Informatika/ FTEIC)

Dini Adni Navastara S.Kom., M.Sc. (T. Informatika/ FTEIC)

Shintami Chusnul Hidayati, S.Kom., M.Sc., Ph.D. (T. Informatika/ FTEIC)

DIREKTORAT PENELITIAN DAN PENGABDIAN KEPADA MASYARAKAT

INSTITUT TEKNOLOGI SEPULUH NOPEMBER

(2)

DAFTAR ISI

DAFTAR ISI ... i

DAFTAR GAMBAR ... ii

DAFTAR TABEL ... iii

Bab 1. RINGKASAN ... 1

1.1. Latar Belakang Penelitian ... 1

1.2. Tujuan ... 1

1.3. Metodologi... 2

1.4. Luaran ... 2

1.5. Kata Kunci ... 2

Bab 2. LATAR BELAKANG ... 3

2.1. Latar Belakang Masalah ... 3

2.2. Permasalahan ... 3

2.3. Urgensi Penelitian ... 4

2.4. Spesifikasi Khusus ... 4

Bab 3. TINJAUAN PUSTAKA ... 5

3.1. Definisi Teks Spam pada Review Produk ... 5

3.2. Algoritma Pembangkitan Teks ... 6

Bab 4. METODE ... 7

(3)

DAFTAR GAMBAR

Gambar 3-1 Peta penelitian terkait pembangkitan teks spam pada review

produk ... 6

Gambar 4-1 Tahapan proses implementasi modul dalam model pembangkitan

(4)

DAFTAR TABEL

Tabel 1

... Contoh teks spam pada review produk music player berdasarkan

kategori ... 5

Tabel 2

Tugas masing-masing anggota dalam tim peneliti ... 8

(5)

1

Bab 1.

RINGKASAN

1.1. Latar Belakang Penelitian

Review produk online menjadi sumber informasi penting dalam pembelian

sebuah layanan maupun produk [1]. Namun terdapat masalah dalam review online

yaitu adanya oknum yang melakukan review palsu (spam)

1

untuk meningkatkan

peringkat suatu produk, sehingga sistem deteksi review perlu dilakukan [2]. Review

palsu juga berupa iklan produk lain, pertanyaan atau pernyataan tidak relevan dengan

produk yang ditampilkan. Banyak penelitian terkait deteksi atau klasifikasi spam

pada review produk online [3]. Salah satu tantangan dalam deteksi spam adalah

keterbatasan jumlah data review palsu karena pengumpulan data secara manual untuk

pembelajaran sistem membutuhkan banyak waktu dan tenaga. Koleksi data review

yang tersedia pada umumnya tidak memiliki label sehingga hasil pembelajaran

sistem memberikan akurasi rendah. Hal tersebut dapat disebabkan oleh terbatasnya

teks pada review produk yang biasanya terdiri dari 1-3 kalimat. Pembangkitan kata

menjadi kalimat yang membentuk teks seperti review produk memperhitungkan

urutan kemunculan kata untuk menghasilkan kalimat logis. Hubungan antar kata

menjadi kalimat dan kemudian teks review tersebut dimodelkan dalam suatu jaringan

saraf [4]. Hal yang harus diperhitungkan antara lain distribusi kalimat pada koleksi

teks sebagai data belajar, sehingga kalimat sintetis yang dihasilkan mempertahankan

fitur sintatik (urutan) dan semantik (makna) kalimat asli. Oleh karena itu

pembangkitan data review palsu dengan memperhitungkan fitur kalimat yang

diusulkan dalam penelitian ini dapat menjadi salah satu alternatif solusi sumber data.

1.2. Tujuan

Penelitian ini bertujuan untuk memodelkan pembangkitan teks review produk

yang menjaga karateristik kalimat secara sintatik dan simantik pada data belajar

terbatas berdasarkan pendekatan jaringan saraf dengan deep learning.

(6)

2

1.3. Metodologi

a. Pengumpulan data dilakukan dengan mengambil beberapa review produk dari

beberapa situs, yang dilanjutkan pelabelan secara manual untuk mengenali

review asli atau spam. Jumlah data akan dibatasi untuk pengujian model

pembangkitan data spam dengan keterbatasan data.

b. Kemudian pemrosesan data untuk mendapatkan bobot dan distribusi kata serta

kalimat sebagai input model pembangkitan. Word embedding atau proses

transformasi serangkaian kata menjadi suatu nilai numerik dilakukan dengan

berbagai strategi, misal frekuensi kemunculan kata (misal: term frequency,

document frequency) atau transformasi nilai frekuensi dengan memperhatikan

urutan kemunculan kata berikut (misal: word2vec, glove, dll).

c. Selanjutnya berbagai arsitektur deep learning yang sesuai untuk pembangkitan

teks akan dievaluasi, misal arsitektur Recurrent Neural Network (RNN) atau

Generative Adversarial Network (GAN) yang akan dibandingkan dengan model

pembangkitan berdasarkan peluang seperti Latent Dirichlet Allocation (LDA)

atau Hidden Markov Model (HMM).

d. Desain

model

pembangkitan

kata

sebagai

luaran

penelitian

akan

memperhitungkan pemilihan data belajar, nilai-nilai terkait ekstraksi fitur kata

serta kalimat secara sintatik dan semantik, dan juga arsitektur deep learning

dengan parameter yang paling sesuai.

1.4. Luaran

Luaran wajib adalah publikasi di jurnal internasional dengan target

International Journal of Intelligent Engineering and Systems (

http://www.inass.org/

)

Scopus Q2 SJR 0.19

1.5. Kata Kunci

pembangkitan teks (text generation), review palsu (fake review), spam, deep

learning, fitur sintatik (urutan kata), fitur semantik (makna kata)

(7)

3

Bab 2.

LATAR BELAKANG

2.1. Latar Belakang Masalah

Deteksi review palsu atau spam membutuhkan sejumlah data belajar yang

cukup untuk kelas “review asli” dan kelas “review palsu”. Pengumpulan data review

tersedia pada umumnya mendapatkan teks review tanpa label kelas sehingga

dibutuhkan pelabelan manual. Meskipun pendekatan algoritma semi-supervised

dapat membantu otomasi proses pelabelan [5], namun masih terdapat beberapa

tahapan pemrosesan data teks menjadi numerik. Berdasarkan perkembangan

algoritma deep learning yang mengurangi tahapan pemrosesan data input, maka

pendekatan pembangkitan teks [6] dengan deep learning dapat menjadi alternatif

sumber data, misal Generative Adversarial Network (GAN).

Terdapat dua komponen utama GAN yaitu discriminator yang akan

membedakan data “review asli” dengan data “review palsu” serta generator yang

menghasilkan teks sintetis. Luaran teks sintetis tersebut akan dianggap oleh

discriminator sebagai data “review asli”. Untuk menghasilkan teks sintetis tersebut

GAN membutuhkan jumlah kalimat yang cukup banyak dan bisa mencapai ribuan,

sedangkan ketersediaan teks review asli pada umumnya tidak banyak dan hanya

mencapai ratusan. Penelitian terkait pembangkitan kalimat sering mengambil teks

berita yang memiliki karakteristik kalimat berbeda dengan review produk. Teks

review memerlukan analisis semantik untuk mengenali pendapat positif atau negatif

dari suatu produk. Sehingga diperlukan suatu model pembangkitan kata berbasiskan

deep learning yang dapat menghasilkan teks sintetis untuk review produk dari data

belajar dengan jumlah terbatas.

2.2. Permasalahan

a. Penentuan modul untuk pembangkitan kata dengan arsitektur deep learning tanpa

pemrosesan kata.

b. Penentuan modul pemrosesan kata sebagai input arsitektur deep learning pada

model pembangkitan kata yang diusulkan.

(8)

4

c. Penentuan prosedur persiapan pembelajaran pada model pembangkitan kata yang

diusulkan.

d. Penentuan prosedur evaluasi klasifikasi data review produk menggunakan teks

sintetis yang dihasilkan dari model pembangkitan kata yang diusulkan.

2.3. Urgensi Penelitian

Model pembangkitan data spam dengan deep learning yang dihasilkan dari

penelitian ini diharapkan dapat membantu pengumpulan data kelas “review palsu”

tanpa adanya kerumitan tahapan praproses. Kemudian dengan jumlah teks review

produk yang berimbang untuk kedua kelas maka dapat ditentukan sistem deteksi

review palsu yang lebih baik. Sistem tersebut membantu menghindari kecurangan

dalam menaikan peringkat produk sehingga memberikan layanan lebih baik kepada

konsumer.

2.4. Spesifikasi Khusus

Untuk menghasilkan model pembangkitan teks review produk tergolong data

spam (atau kelas “review palsu”), maka spesifikasi proses yang dibutuhkan adalah

sebagai berikut.

a. Melakukan analisis model pembangkitan kata dengan arsitektur deep learning

yang sesuai tanpa pemrosesan kata.

b. Melakukan analisis pemrosesan kata sebagai input arsitektur deep learning

sehingga menghasilkan teks sintetis yang logis sesuai makna.

c. Melakukan analisis data belajar pada model pembangkitan kata yang telah

ditentukan sehingga meminimalkan jumlah data.

d. Melakukan analisis klasifikasi data review produk menggunakan teks sintetis

berdasarkan tingkat akurasi kebenaran pelabelan.

(9)

5

Bab 3.

TINJAUAN PUSTAKA

Penelitian terdahulu terkait model pembangkitan teks spam review produk

ditunjukkan pada Gambar 3-1.

3.1. Definisi Teks Spam pada Review Produk

Pada penelitian terdahulu, data spam review produk atau kelas “review palsu”

dapat dikategorikan sebagai untruthfull-opinion (spam tipe-1), review-brand-only

(spam tipe-2), dan non-review (spam tipe-3) [7] seperti yang ditunjukkan pada Tabel

1. Teks spam tipe-1 berisi kalimat terkait produk yang tidak bisa dipercaya karena

mempromosikan produk dan bukan pendapat pengguna akan produk tersebut, atau

kalimat yang dapat menjatuhkan reputasi produk pesaing. Teks spam tipe-2 tidak

memberikan review tentang produk namun hanya menyebutkan merk produk saja

sehingga menghasilkan review yang bias. Teks spam tipe-3 berupa iklan yang tidak

relevan atau kalimat tanpa pendapat seperti pertanyaan, jawaban, atau teks random.

Tabel 1 Contoh teks spam pada review produk music player berdasarkan kategori

Kategori teks spam Contoh teks spam pada review produk

Teks spam tipe-1 “I bought the Sansa e260 4 GB and I love it. It had all the features I was looking for. MP3 player, photos, video and FM Tuner. Also I like the fact that it had a SD expansion slot. This was my first Mp3 player. It was easy to use. Not complicated at all. I did alot of shopping around before I bought it and I know I got the best deal for my money. If you are looking for a good MP3 player with alot of features for the money then this player is for you.”

Teks spam tipe-2 “The iPod is better, more popular, and more compatible. Why go against the grain. Do the right thing and go Apple.”

Teks spam tipe-3 “two things, is there a case for this thing you can buy anywhere? also, is it the same size as the 20 GB model? Thanks!”

Deteksi kelas teks spam tipe-2 dan teks spam tipe-3 lebih mudah dilakukan

[8] menggunakan metode klasifikasi dibandingkan dengan pengenalan kelas teks

(10)

6

spam tipe-1. Oleh karena itu pelabelan manual perlu dilakukan untuk menghasilkan

sistem deteksi spam review produk yang baik.

3.2. Algoritma Pembangkitan Teks

Istilah spam sering dikaitkan dengan email spam [9] namun pada penelitian

ini teks spam merujuk pada kalimat-kalimat yang menyatakan review suatu produk.

Penelitian awal terkait kelas “review palsu” dinyatakan sebagai suatu permasalahan

klasifikasi akibat duplikasi kalimat [7] yang diselesaikan dengan pendekatan regresi

atau support vector machine [10], sedangkan pendekatan modern menggunakan

algoritma deep learning [11] yang mengurangi tahapan praproses teks [12]. Akan

tetapi algoritma deep learning membutuhkan data belajar yang cukup banyak.

Kebutuhan data dapat diatasi dengan pengumpulan data teks real lebih banyak atau

menambahkan data teks sintetis berdasarkan data teks real. Untuk meningkatkan

kualitas data teks sintetis dilakukan modifikasi GAN [13] yang membutuhkan umpan

balik dari sekelompok pengguna. Akan tetapi permasalahan muncul jika terdapat

keterbatasan kondisi ketersediaan data sehingga umpan balik tersebut tidak ada. Pada

penelitian ini, tahapan pembangkitan teks spam difokuskan pada kondisi seminim

mungkin yaitu adanya sejumlah teks dari review tanpa label dan kemungkinan

jumlah tidak imbang dari kelas teks review.

Gambar 3-1 Peta penelitian terkait pembangkitan teks spam pada review produk

(11)

7

Bab 4.

METODE

Pelaksanaan penelitian ini terdiri dari serangkain proses seperti yang

ditunjukkan pada Gambar 4-1. Sesuai dengan permasalahan, maka proses-proses

tersebut terbagi menjadi tiga modul utama yaitu Pemrosesan Kata, Pembangkitan

Teks Sintetis, serta Persiapan Pembelajaran dan Evaluasi.

Gambar 4-1 Tahapan proses implementasi modul dalam model pembangkitan data spam pada teks review produk

Modul Pengumpulan Data akan mengambil data-data teks review pelanggan

pada produk hasil dari crawling web Amazon. Untuk generalisasi produk maka

terdapat beberapa jenis produk manufaktur seperti barang elektronik antara lain

laptop, kamera, dan cd player. Data hasil crawling tersebut masih belum memiliki

label sehingga perlu dilakukan pelabelan terlebih dahulu sesuai dengan kelas spam,

yaitu: “review asli” dan “review palsu” terdiri dari spam tipe-1, spam tipe-2, dan

spam tipe-3. Pada penelitian terdahulu telah dilakukan pelabelan otomatis untuk teks

artikel ilmiah [14] dan review mahasiswa akan layanan akademik [15]. Kemudian

(12)

8

untuk evaluasi hasil pembangkitan teks berdasarkan variasi fitur maka dilakukan

ekstraksi fitur berdasarkan frekuensi sebagai baseline. Sebagai pembanding dan

kontribusi dalam penelitian ini maka ekstraksi fitur secara sintatik dan semantik juga

dilakukan. Fitur semantik terkait analisis sentimen telah dilakukan sebelumnya [16].

Modul Pembangkitan Teks Sintetis akan melakukan evaluasi arsitektur deep

learning dengan input teks sesuai variasi fitur. Kemudian dengan arsitektur terpilih

maka teks sintetis akan dihasilkan. Selanjutnya Modul Persiapan Pembelajaran dan

Evaluasi akan mengolah teks sintetis untuk melihat keberhasilan modul pembangkit

teks yang diusulkan dalam penelitian ini berdasarkan skenario: pembentukan data

belajar, indikator keberhasilan, dan model klasifikasi. Beberapa skenario evaluasi

produk berdasarkan teks review telah dilakukan sebelumnya [17] berdasarkan

peringkat kepopuleran [18].

Tugas anggota tim peneliti terkait dengan modul-modul tersebut ditunjukkan

pada Tabel 2.

Tabel 2 Tugas masing-masing anggota dalam tim peneliti

Nama Peran Keterangan

Diana Purwitasari

Ketua Koordinasi, desain proses dan algoritma model dalam sistem, analisis hasil evaluasi model, pembuatan artikel publikasi, review laporan kegiatan

Chastine Fatichah

Anggota 1 Review desain proses dan algoritma model dalam sistem, analisis hasil evaluasi model, review artikel publikasi, review laporan kegiatan

Dini Adni Navastara

Anggota 2 Validasi data, analisis hasil evaluasi model, pembuatan artikel publikasi, pembuatan laporan kegiatan

Shintami Chusnul Hidayati

Anggota 3 Validasi data, analisis hasil evaluasi model, pembuatan artikel publikasi, pembuatan laporan kegiatan

Ana Alimatus Zaqiyah Anggota Mahasiswa Pengumpulan data

Implementasi proses dan algoritma model dalam sistem Evaluasi model dalam sistem rekomendasi

Staf ITS (tendik)

Administrasi peneliti

Pembuatan laporan kegiatan

(13)

9

Bab 5.

JADWAL

Meskipun pendanaan hanya dialokasikan untuk 10 bulan namun kegiatan

telah dilakukan pada tahun usulan ini.

N

o

Nama Kegiatan

Bulan Januari-Desember 2020

1

2

3

4

5

6

7

8 9 10 11 12

1

Kaji pustaka terkait deteksi teks review produk

2 Kaji pustaka DL untuk pembangkitan teks

3 Kaji pustaka terkait _{sistem deteksi}

4 Pengumpulan dan _{validasi data}

5

Ekstraksi fitur kuantitas, sintatik dan semantik

6 Identifikasi model _{pembangkitan kata} 7 Pembentukan teks _sintetis

8

Modul Persiapan Pembelajaran dan Evaluasi

9 Pembuatan artikel 10 Pembuatan laporan _kegiatan

Rancangan Dana untuk pelaksanaan kegiatan selama 10 bulan diusulkan

dengan total kebutuhan Rp. 49,659,000 seperti yang ditunjukkan pada tabel berikut.

Komponen utama pada pendanaan meliputi Bahan, Pengumpulan Data, Analisis

Data, Pelaporan, dan Luaran.

(14)

10

KOMPONEN ITEM SATUAN VOLUME HARGA TOTAL

ATK Paket ATK (kertas, toner printer, dll) paket 1 984,000 984,000 Bahan Penelitian (Habis Pakai) SAMSUNG Solid State Drive 860 EVO 1TB M.2 SATA buah 1 3,025,000 3,025,000 Bahan Penelitian (Habis Pakai) Pulsa data paket 10 100,000 1,000,000 FGD persiapan penelitian koordinasi paket 9 200,000 1,800,000 HR Pembantu Peneliti 1 mahasiswa, 5 bulan OJ 525 25,000 13,125,000 HR Sekretariat/Administrasi Peneliti staf PT OB 3 300,000 900,000 HR Pengolah Data 1 mahasiswa, 5 bulan OJ 525 25,000 13,125,000 HR Sekretariat/Administrasi Peneliti staf PT OB 3 300,000 900,000 Biaya konsumsi rapat koordinasi paket 9 200,000 1,800,000 HR Sekretariat/Administrasi Peneliti staf PT OB 4 300,000 1,200,000 Biaya konsumsi rapat koordinasi paket 9 200,000 1,800,000 Publikasi artikel di Jurnal Internasional Proofread, pendaftaran paket 1 10,000,000 10,000,000

(15)

11

DAFTAR PUSTAKA

[1] Z.-P. Fan, G.-M. Li, and Y. Liu, “Processes and methods of information fusion for ranking products based on online reviews: An overview,” Inf. Fusion, 2020. [2] R. Barbado, O. Araque, and C. A. Iglesias, “A framework for fake review detection

in online consumer electronics retailers,” Inf. Process. Manag., vol. 56, no. 4, pp. 1234–1244, 2019.

[3] Y. Wu, E. W. T. Ngai, P. Wu, and C. Wu, “Fake online reviews: Literature review, synthesis, and directions for future research,” Decis. Support Syst., p. 113280, 2020. [4] Y. Li, Q. Pan, S. Wang, T. Yang, and E. Cambria, “A Generative Model for

category text generation,” Inf. Sci. (Ny)., vol. 450, pp. 301–315, 2018.

[5] D. Hernández Fusilier, M. Montes-y-Gómez, P. Rosso, and R. Guzmán Cabrera, “Detecting Positive and Negative Deceptive Opinions Using PU-Learning,” Inf. Process. Manag., vol. 51, no. 4, pp. 433–443, Jul. 2015.

[6] L. Yu, W. Zhang, J. Wang, and Y. Yu, “SeqGAN: Sequence Generative Adversarial Nets with Policy Gradient,” in Proceedings of the Thirty-First AAAI Conference on Artificial Intelligence, 2017, pp. 2852–2858.

[7] N. Jindal and B. Liu, “Opinion Spam and Analysis,” in Proceedings of the 2008 International Conference on Web Search and Data Mining, 2008, pp. 219–230. [8] A. A. Zaqiyah, Deteksi Opini Spam pada Review Produk menggunakan Support

Vector Machine. Tugas Akhir Departemen Informatika, Fakultas Teknologi Informasi dan Komunikasi, Institut Teknologi Sepuluh Nopember, 2019.

[9] H. Drucker, Donghui Wu, and V. N. Vapnik, “Support vector machines for spam categorization,” IEEE Trans. Neural Networks, vol. 10, no. 5, pp. 1048–1054, 1999. [10] M. Ott, C. Cardie, and J. T. Hancock, “Negative Deceptive Opinion Spam,” in

Proceedings of the 2013 Conference of the North American Chapter of the

Association for Computational Linguistics: Human Language Technologies, 2013, pp. 497–501.

[11] H. Aghakhani, A. Machiry, S. Nilizadeh, C. Kruegel, and G. Vigna, “Detecting Deceptive Reviews Using Generative Adversarial Networks,” in 2018 IEEE Security and Privacy Workshops (SPW), 2018, pp. 89–95.

[12] M. Crawford, T. M. Khoshgoftaar, J. D. Prusa, A. N. Richter, and H. Al Najada, “Survey of review spam detection using machine learning techniques,” J. Big Data, vol. 2, no. 1, p. 23, 2015.

[13] K. Lin, D. Li, X. He, Z. Zhang, and M.-T. Sun, “Adversarial Ranking for Language Generation,” in Proceedings of the 31st International Conference on Neural Information Processing Systems, 2017, pp. 3158–3168.

[14] A. Nurilham, D. Purwitasari, and C. Fatichah, “Ekstraksi Frasa pada Pelabelan Kelompok Artikel Ilmiah dengan Penggabungan Klaster berdasarkan

MaximumCommonSubgraph,” J. Nas. Tek. Elektro dan Teknol. Inf., vol. 7, no. 3, 2018.

[15] T. Fahrudin, J. L. Buliali, and C. Fatichah, “Ina-BWR: Indonesian bigram word rule for multi-label student complaints,” Egypt. Informatics J., vol. 20, no. 3, pp. 151– 161, 2019.

[16] B. S. Rintyarna, R. Sarno, and C. Fatichah, “Evaluating the performance of sentence level features and domain sensitive features of product reviews on supervised sentiment analysis tasks,” J. Big Data, vol. 6, no. 1, p. 84, 2019.

(16)

12

[17] A. Z. Arifin et al., “Automatic Comparison of Products based on Opinion Features using Synonym and Jaccard Similarity,” in 2018 Third International Conference on Informatics and Computing (ICIC), 2018, pp. 1–6.

[18] S. C. Hidayati, Y.-L. Chen, C.-L. Yang, and K.-L. Hua, “Popularity Meter: An Influence- and Aesthetics-Aware Social Media Popularity Predictor,” in

Proceedings of the 25th ACM International Conference on Multimedia, 2017, pp. 1918–1923.

(17)

Biodata Tim Peneliti

1. Ketua

a. Nama Lengkap

: Dr. Diana Purwitasari, S.Kom, M.Sc.

b. NIP/NIDN

: 197804102003122001/ 0010047803

c. Fungsional/Pangkat/Gol.

: Lektor Kepala/ Pembina / IVa

d. Bidang Keahlian

:

Analisa Jejaring Sosial, Temu Kembali Informasi, Kecerdasan Komputasional

e. Departemen/Fakultas

: T. Informatika/ FTEIC

f. Alamat Rumah dan No. Telp.

:

Wisma Permai V/ 15, Mulyorejo, Surabaya (081330318786)

g. Riwayat penelitian (2 tahun terakhir)

1. Dana Lokal ITS 2019, Pengembangan framework data publikasi ilmiah untuk rekomendasi sitasi berdasarkan topik penelitian (anggota)

2. PUPT 2018: Sistem Pakar Analisis DNA Hepatitis Berdasarkan Clustering Sequence terhadap Centroid Primer Sebagai Dasar Evaluasi Mutasi Genetik (anggota)

3. WCP-A 2018: Fuzzy Multi Attribute Decision Making for Diverse Signals on Biomedical Engineering (anggota)

4. Dana Lokal ITS 2018, Klasterisasi tren topik penelitian untuk rekomendasi pengadaan bahan pustaka di perpustakaan ITS (anggota)

h. Riwayat pengabdian (2 tahun terakhir)

-

i. Publikasi (2 tahun terakhir)

1. D. Purwitasari, C. Fatichah, S. Sumpeno, et al. "Identifying collaboration dynamics of bipartite author-topic networks with the influences of interest changes", Scientometrics 122: 1407–1443, 2020

2. D. Purwitasari, C. Fatichah, A. G. Sooai, S. Sumpeno and M. H. Purnomo, "Productivity-based Features from Article Metadata for Fuzzy Rules to Classify Academic Expert", 2019 IEEE 10th International Conference on Awareness Science and Technology (iCAST), Morioka, Japan, 2019, pp. 1-6

3. D. Purwitasari, A. B. Ilmi, C. Fatichah, W. A. Fauzi, S. Sumpeno and M. H. Purnomo, "Conflict of Interest based Features for Expert Classification in Bibliographic Network," 2018 International Conference on Computer Engineering, Network and Intelligent Multimedia (CENIM), Surabaya, Indonesia, 2018, pp. 54-59

(18)

4. V. Zuraida, D. Purwitasari, C. Fatichah, "Cross-Domain Topic Learning Berbasis Frase untuk Pemodelan Topik pada Rekomendasi Kolaborasi Penelitian", INTEGER: Journal of Information Technology 3 (2), 2018

5. D. Purwitasari, C. Fatichah, S. Sumpeno, M.H. Purnomo, "Ekstraksi Ciri Produktivitas Dinamis untuk Prediksi Topik Pakar dengan Model Discrete Choice", JNTETI: Jurnal Nasional Teknik Elektro dan Teknologi Informasi 7 (4): 418-426, 2018

6. A.Nurilham, D. Purwitasari, C. Fatichah, "Ekstraksi Frasa Kunci pada Penggabungan Klaster berdasarkan Maximum-Common-Subgraph", JNTETI: Jurnal Nasional Teknik Elektro dan Teknologi Informasi 7 (3): 249-257, 2018

j. Paten (2 tahun terakhir)

-

k. Tugas Akhir, Tesis, Disertasi (2 tahun terakhir)

-

2. Anggota 1

a. Nama Lengkap

: Dr. Eng. Chastine Fatichah, S.Kom, M.Kom

b. NIP/NIDN

: 197512202001122002/ 0020127508

c. Fungsional/Pangkat/Gol.

: Lektor Kepala/ Pembina / IVa

d. Bidang Keahlian

:

Kecerdasan Komputasional, Komputasi Biomedik, Data Mining

e. Departemen/Fakultas

: T. Informatika/ FTEIC

f. Alamat Rumah dan No. Telp.

:

T.Kelautan, Perumdos ITS T-4, Keputih, Sukolilo, Surabaya (08111779483)

g. Riwayat penelitian (2 tahun terakhir) yang paling relevan

1. PTUPT 2019-2018: Deteksi kejadian di perkotaan melalui crowdsourcing berbasis informasi spasial dan temporal menggunakan metode deep learning (ketua) 2. PDD 2019: Ekstraksi user story dari natural language untuk identifikasi software

requirement pada aplikasi sektor publik mengunakan web mining (anggota) 3. PDD 2019: Metode otomatisasi pembangkitan soal berdasarkan taksonomi bloom

berbasis pengenalan pola dan deep learning sebagai dasar standarisasi tingkat kesulitan soal (ketua)

4. PMDSU 2018-2017: Sistem cerdas untuk temu kembali informasi pada dokumen berbahasa Arab (anggota)

h. Riwayat pengabdian (2 tahun terakhir)

 2018, Pembuatan Aplikasi Konversi Data Foto ke Pahatan 3D untuk Pengenalan Obyek bagi Penyandang Tuna Netra, LPPM ITS

(19)

i. Publikasi (2 tahun terakhir)

1. B.S. Rintyarna, R. Sarno, C. Fatichah, "Enhancing the performance of sentiment analysis task on product reviews by handling both local and global context", International Journal of Information and Decision Sciences (IJIDS) 12 (1): 75-101, 2020

2. F.H. Rachman, R. Sarno, C. Fatichah, "Hybrid Approach of Structural Lyric and Audio Segments for Detecting Song Emotion", International Journal of Intelligent Engineering and Systems 13(1): 86-97, 2020

3. B.S. Rintyarna, R. Sarno, C. Fatichah, "Evaluating the performance of sentence level features and domain sensitive features of product reviews on supervised sentiment analysis tasks", Journal of Big Data 6 (84), 2019

4. T. Fahrudin, J.L. Buliali, C. Fatichah, "Ina-BWR: Indonesian bigram word rule for multi-label student complaints", Egyptian Informatics Journal 20 (3): 151-161, 2019

5. A. Saikhu, A.Z. Arifin, C. Fatichah, Correlation and Symmetrical Uncertainty-Based Feature Selection for Multivariate Time Series Classification, International Journal of Intelligent Engineering and Systems 12(3): 129-137, 2019

6. I. K. Raharjana, D. Siahaan and C. Fatichah, "User Story Extraction from Online News for Software Requirements Elicitation: A Conceptual Model," 2019 16th International Joint Conference on Computer Science and Software Engineering (JCSSE), Chonburi, Thailand, 2019, pp. 342-347

7. S. F. Kusuma, D. O. Siahaan, C. Fatichah and M. F. Naufal, "Automatic Question Generation with Classification Based on Mind Map," 2019 16th International Joint Conference on Computer Science and Software Engineering (JCSSE), Chonburi, Thailand, 2019, pp. 336-341

8. F.H. Rachman, R. Sarno, C. Fatichah, "Music Emotion Classification based on Lyrics-Audio using Corpus based Emotion", International Journal of Electrical and Computer Engineering (IJECE) 8 (3): 1720-1730, 2018

9. S. F. Kusuma, R. Z. Alhamri, D. O. Siahaan, C. Fatichah and M. F. Naufal, "Indonesian Question Generation Based on Bloom's Taxonomy Using Text Analysis," 2018 International Seminar on Intelligent Technology and Its Applications (ISITIA), Bali, Indonesia, 2018, pp. 269-274

j. Paten (2 tahun terakhir)

-

k. Tugas Akhir, Tesis, Disertasi (2 tahun terakhir)

1. S1 05111540000091 REINARDUS WANDYA KRESNAPRABOWO Penggunaan cluster importance dan named entity recognition untuk penentuan trending issue data twitter dalam peringkasan multi dokumen berita

2. S1 05111540000123 ARIYA WILDAN DEVANTO Implementasi metode Siamese Recurrent Neural Network pada Aplikasi Chatbot untuk menjawab pertanyaan terkait SBMPTN

3. S1 05111540000115 ANA ALIMATUS ZAQIYAH Deteksi opini spam pada review produk menggunakan Support Vector Machine

(20)

4. S1 05111540000153 R SIDQI TRI PRIWI Aplikasi data mining berbasis web untuk klasifikasi kepribadian pengguna media sosial instagram

5. S1 05111540000168 ROGO JAGAD ALIT Analisis sentimen berbasis aspek dengan pendekatan sequence labelling task

6. S1 05111540000031 DRAJAD BIMA AJIPANGESTU Aplikasi deteksi kejadian lokal di surabaya berdasarkan data twitter menggunakan metode Global Vectors for World Representation (GloVe) dan multiclass Support Vector Machine

7. S3 05111560010001 BAGUS SETYA RINTYARNA Analisa consumer preference berdasarkan sentimen pada aspect dari product review

8. S3 05111460010003 FIKA HASTARITA RACHMAN Pengembangan corpus based emotion dan prediction frequency matrix untuk deteksi emosi lagu berdasarkan lirik dan audio

3. Anggota 2

a. Nama Lengkap

: Dini Adni Navastara S.Kom., M.Sc

b. NIP/NIDN

: 198510172015042001/ 0017108506

c. Fungsional/Pangkat/Gol.

: Asisten Ahli / Penata Muda Tk. I / IIIb

d. Bidang Keahlian

:

Pengolahan Citra, Kecerdasan Buatan, Data Mining

e. Departemen/Fakultas

: T. Informatika/ FTEIC

f. Alamat Rumah dan No. Telp.

:

Perumahan Bumi Marina Emas Barat IV/39 Sukolilo, Surabaya. (081290901862)

g. Riwayat penelitian (2 tahun terakhir) yang paling relevan

1. Dana Lokal ITS 2019, Pengembangan framework data publikasi ilmiah untuk rekomendasi sitasi berdasarkan topik penelitian (ketua)

2. PTUPT 2019, Sistem pengukuran kualitas tulang berdasarkan citra dental cone beam computerized tomography (anggota)

3. Dana Lokal ITS 2018, Klasterisasi tren topik penelitian untuk rekomendasi pengadaan bahan pustaka di perpustakaan ITS (ketua)

4. Dana Lokal ITS 2018, Kombinasi fitur histogram of oriented gradients dan local binary patterns untuk klasifikasi jenis kendaraan (ketua)

h. Riwayat pengabdian (2 tahun terakhir)

 Pengembangan game simulasi untuk efektifitas pemilihan jalur jama’ah tawaf berbasis teknologi virtual reality, Dana Lokal ITS, 2019

 Pembuatan alat bantu belajar 3D untuk siswa tuna netra di SMPLB YPAB Surabaya, Dana Lokal ITS, 2019

(21)

1. D.A. Navastara, E. Mursidah, Y.A. Gonti, D. Wahyuni, P.D.S. Wiyadi, W. Suadi, "Clustering topik penelitian berbasis unsupervised learning untuk rekomendasi koleksi pustaka di perpustakaan ITS", JUTI: Jurnal Ilmiah Teknologi Informasi 17(2): 125-134, 2019

2. C. Fatichah, W.F. Lazuardi, D.A. Navastara, N. Suciati, A. Munif, "Image Spam Detection on Instagram Using Convolutional Neural Network", Intelligent and Interactive Computing Conference (IIC 2018), Universiti Teknikal Malaysia, Melaka

3. A. Z. Arifin et al., "Automatic Comparison of Products based on Opinion Features using Synonym and Jaccard Similarity," 2018 Third International Conference on Informatics and Computing (ICIC), Palembang, Indonesia, 2018, pp. 1-6.

j. Paten (2 tahun terakhir)

-

k. Tugas Akhir, Tesis, Disertasi (2 tahun terakhir)

1. S1 05111540000109 REZKY ALAMSYAH Sistem temu kembali sitasi dan visualisasi pakar berdasarkan topik penelitian

2. S1 05111540000049 MOHAMMAD FIKRI Klasifikasi multi-label dokumen teks berdasarkan fitur named entity dan judul pada artikel berita

3. S1 05111540000115 ANA ALIMATUS ZAQIYAH Deteksi opini spam pada review produk menggunakan Support Vector Machine

4. S1 05111540000168 ROGO JAGAD ALIT Analisis sentimen berbasis aspek dengan pendekatan sequence labelling task

5. S1 05111540000031 DRAJAD BIMA AJIPANGESTU Aplikasi deteksi kejadian lokal di surabaya berdasarkan data twitter menggunakan metode Global Vectors for World Representation (GloVe) dan multiclass Support Vector Machine

6. S1 05111440000119 FARIS SALBARI Deteksi depresi berdasarkan data twitter menggunakan convolutional neural network

4. Anggota 3

a. Nama Lengkap

: Shintami Chusnul Hidayati, S. Kom., M.Sc., Ph.D.

b. NIP/NIDN

: -

c. Fungsional/Pangkat/Gol.

: -

d. Bidang Keahlian

:

Komputasi Multimedia, Pengenalan Pola, Visi Komputer

e. Departemen/Fakultas

: T. Informatika/ FTEIC

f. Alamat Rumah dan No. Telp.

:

Siwalankerto Tengah 92B Surabaya (082231512070)

g. Riwayat penelitian (2 tahun terakhir) yang paling relevan

(22)

StyleMe: An AI Fashion Consultant for Personal Shopping and Style Advice, Microsoft

Research, 2018.

h. Riwayat pengabdian (2 tahun terakhir)

-

i. Publikasi (2 tahun terakhir)

1. S. C. Hidayati, C. You, W. Cheng and K. Hua, "Learning and Recognition of Clothing Genres From Full-Body Images," in IEEE Transactions on Cybernetics, vol. 48, no. 5, pp. 1647-1659, May 2018.

2. S. C. Hidayati, K. Hua, Y. Tsao, H. Shuai, J. Liu and W. Cheng, "Garment Detectives: Discovering Clothes and Its Genre in Consumer Photos," 2019 IEEE Conference on Multimedia Information Processing and Retrieval (MIPR), San Jose, CA, USA, 2019, pp. 471-474.

3. S. C. Hidayati, Y.L. Chen, C.L. Yang, and K.L. Hua. 2017. Popularity Meter: An

Influence- and Aesthetics-aware Social Media Popularity Predictor. In Proceedings of the 25th ACM international conference on Multimedia (MM ’17).