UNIVERSITAS MERCU BUANA
FAKULTAS : ILMU KOMPUTERPROGRAM STUDI : SISTEM INFORMASI
No. Dokumen 02-3.04.1.02 Distribusi
Tgl. Efektif
RENCANA PEMBELAJARAN SEMESTER
Mata Kuliah Kode Rumpun MK Bobot (SKS) Semester Tanggal Penyusunan
Informartion Retrieval XXX 3 7 10-07-2017
Otorisasi
Dosen Pengemban RPS Koordinator RMK Ketua Program Studi
Hendra Prastiawan, S.SI., MT Hendra Prastiawan, S.SI., MT Nur Ani, ST, MMSI Capaian
Pembelajaran
CPL – Prodi
Mahasiswa mempelajari dan memahami prinsip, teknik, dan metode IR.
Mampu menyelesaikan masalah teknologi informasi dan komunikasi dengan keahlian komputasi cerdas dan visualisasi CP – Mata Kuliah
Mahasiswa mampu mengaplikasikan prinsip, teknik, dan metode IR secara umum seperti pengindeksan, mesin pencari, klasifikasi, peringkasan dokumen, web search, dan berbagai aplikasi IR lainnya.
Mahasiswa dapat mengimplementasikan teknik IR dari berbagai bentuk dokumen teks, baik desktop maupun web.
Mahasiswa mendapat topik riset (skripsi), berlatih menelaah jurnal, dan presentasi.
Mahasiswa mengimplementasikan teknik-teknik penyelesaian masalah seperti pengindeksan, pencarian, pemrosesan query dalam kebutuhan temu kembali informasi.
Mahasiswa mampu membuat suatu mesin pencari untuk ektraksi informasi sebagai contoh implementasi sederhana dan mengkategorikan hasil demi kemudahan visualisasi.
Deskripsi Singkat Mata Kuliah
Matakuliah ini mempelajari prosedur-prosedur dan metode-metode untuk menemukan kembali informasi yang tersimpan dari berbagai sumber (resources) yang relevan atau koleksi sumber informasi yang dicari atau dibutuhkan. Dengan tindakan index (indexing), panggilan (searching), pemanggilan data kembali (recalling). Mahasiswa akan mempelajari teknik-teknik pengolahan data teks untuk menemukan kembali informasi pada data berbentuk teks. Bahasan perkuliahan meliputi pengolahan awal, ekstraksi fitur, penghitungan tingkat kemiripan teks sesuai masukan query, dan menampilkan hasil pencarian. Bahasan lanjut adalah teknik relevance feedback, klasifikasi dan klasterisasi teks untuk membantu
pengguna dalam pencarian. Mahasiswa akan merancang, menganalisis serta mengaplikasikan metode-metode sistem temu kembali informasi pada berbagai permasalahan nyata baik secara mandiri atau kerjasama tim.
Materi
Pembelajaran/ Pokok Bahasan
1. Konsep dasar Information Retrieval (IR) 2. Pemodelan IR dan Evaluasi IR
3. Query Expansion dan Algoritma Rocchio 4. Text Classification dan Clustering
5. Probabilistic Information Retrieval, CLIR dan Web Information Retrieval
Pustaka Utama (1,2)
1. C.J. van Rijsbergen. Information Retrieval
2. Christopher D. Manning, Prabhakar Raghavan, Hinrich Schütze, Introduction to Information Retrieval, Cambridge University Press, 2008 Pendukung (3, 4, 5, 6, 7)
3. Baeza-Yates & Ribeiro-Neto, Modern Information Retrieval Complete, 2011 4. Gerald Kowalski, Information Retrieval Architecture and Algorithm, Springer, 2011
5. B. Croft, D. Metzler, & T. Strohman, Search Engines: Information Retrieval in Practice, Addison Wesley, 2009. 6. D. Grossman & O. Frieder, Information Retrieval: Algorithms and Heuristics 2nd Edition, Springer, 2004. 7. I. H. Witten, Managing Gigabytes, Morgan Kaufman, 1999
Media
Pembelajaran
Perangkat Lunak Perangkat Keras
Team Teaching Mata Kuliah Prasyarat
Sistem Basis Data
Minggu Ke-
Sub-CP-MK
(Sebagai Kemampuan Akhir yang diharapkan)
Materi Pembelajaran [Pustaka]
Indikator Kriteria & Bentuk Penilaian Metode Pembelajaran [estimasi waktu] Pengalaman Belajar Mahasiswa Bobot Penilaian (1) (2) (3) (4) (5) (6) (7) (8) 1. ● Membedakan antara
Information Retrieval dan Data Mining serta
menggambarkan gagasan tentang aplikasi information retrieval ● Definisi Information Retrieval, Ruang Lingkup dan Penerapan Information ● Dapat menjelaskan definisi information retrieval, memberikan contoh information retrieval, dan ● Penyampaian materi konsep, sejarah, lingkup dan penerapan, serta contoh ● Penyampaian materi: 60 menit ● Diskusi mahasiswa: 60 menit ● Mahasiswa dapat menjelaskan definisi dan konsep dari information retrieval serta 5%
Retrieval, Contoh Information Retrieval merencanakan suatu aplikasi information retrieval information retrieval ● Melakukan tanya jawab pemahaman mahasiswa ● Presentasi hasil diskusi: 30 menit dapat memberikan contoh dari information retrieval 2. ● Memiliki kemampuan
dalam pemrosesan teks dan kalimat dengan menggunakan bahasa pemrograman perl/phyton ● Pemrosesan Teks, Pengantar bahasa PERL/Phyton ● Dapat melakukan pemrosesan teks berupa kata dan kalimat dengan menggunakan bahasa pemrograman perl/phyton ● Penyampaian materi mengenai definisi korpus beserta contohnya, pemrosesan kata yang dimulai dari melacak teks, statistik teks serta menghitung frekuensi kata melalui stopwords dan tokenisasi ● melakukan simulasi pemrosesan teks menggunaka n bahasa pemrograma n perl/phyton ● Penyampaian materi: 90 menit ● Pengantar bahasa pemrograman perl/phyton beserta simulasi pemrosesan teks: 60 menit ● Mahasiswa dapat memahami pengertian dari teks, kata dan kalimat dalam sebuah pemrosesan teks dengan menggunakan hukum Zipf ● Mahasiswa dapat melakukan pemrosesan teks dengan menggunakan bahasa pemrograman perl/phyton ● Mahasiswa dapat melakukan beberapa manipulasi teks dengan bahasa pemrograman perl/phyton 5%
3. ● Kemampuan dalam pengindeksan secara manual dan otomatis, tokenisasi, stopwords, dan stemming serta
pembobotan sebuah kata
● Inverted Text ● Indexing ● Tokenisasi ● Stopwords ● Stemming ● Pembobotan kata ● Dapat melakukan pengindeksan teks, pembagian teks berupa kalimat, paragraf, dan dokumen ● Dapat melakukan proses stopwords dan stemming untuk efisiensi dan efektivitas pemrosesan teks ● Dapat melakukan pembobotan kata dengan beberapa pendekatan seperti term frequency, document frequency, dan inverse document frequency ● Penyampaian materi mengenai indexing, tokenisasi, stopwords, dan proses stemming ● Menyelesaik an beberapa contoh pemrosesan teks baik berupa kalimat maupun dokumen ● Memberikan bobot pada sebuah kata didalam pemrosesan teks dengan menggunaka n beberapa pendekatan ● Penyampaian materi: 90 menit ● Latihan dan penyelesaian studi kasus: 60 menit ● Mahasiswa dapat mengetahui dan melakukan tahapan-tahapan didalam pemrosesan teks dan juga melakukan pembobotan kata 5% 4. ● Memiliki pengetahuan mengenai pemodelan Information Retrieval (IR) seperti Boolean Model, dan Vector Space Model
● Pemodelan IR ● Boolean Model ● Vector Space Model ● Dapat mendefinisikan beberapa model dari Information Retrieval beserta tahapan-tahapan dari masing-masing model IR ● Mendefinisik an masing-masing model IR beserta proses-proses didalamnya ● Penyampaian materi: 90 menit ● Latihan dan penyelesaian studi kasus: 60 menit ● Mahasiswa dapat menjelaskan model-model IR beserta memberikan contoh dari proses setiap model IR 5%
5. ● Memiliki kemampuan dalam mengukur tingkat relevansi dan akurasi dari pemrosesan teks ● Evaluasi IR: Recall & Precision, Single Value Summaries, User Oriented Measures, Web Search Approach ● Dapat melakukan pengukuran dasar keefektifan IR untuk mendapatkan tingkat relevansi dan akurasi dari pemrosesan teks ● Melakukan evaluasi IR dari hasil pemrosesan teks yang sudah melalui proses perhitungan dan pengolahan teks ● Penyampaian Materi: 60 Menit ● Latihan dan penyelesaian studi kasus: 90 menit ● Mahasiswa dapat melakukan pengukuran evaluasi IR untuk mendapatkan tingkat relevansi dan akurasi dari hasil pemrosesan teks 5% 6. ● Memiliki kemampuan
untuk memberikan umpan balik pada dokumen hasil pemrosesan teks yang dianggap relevan ● Memiliki kemampuan
untuk memformulasikan query yang lebih baik ketika tidak ada informasi dari koleksi yang ada
● Relevance Feedback ● Query Expansion ● Algoritma Rocchio ● Dapat memberikan umpan balik dari dokumen hasil pemrosesan teks untuk
memformulasikan query yang lebh baik sehingga dapat memperoleh hasil yang lebih relevan ● Penyampaian materi mengenai Relevance Feedback, Query Expansion dan Algoritma Rocchio disertai dengan penyelesaian studi kasus ● Penyampaian Materi: 60 Menit ● Latihan dan penyelesaian studi kasus: 90 menit ● Mahasiswa dapat memberikan umpan balik dan memformulasi kan kembali query sehingga dapat memperoleh hasil yang lebih relevan 5% 7. ● Memiliki kemampuan untuk pengelompokan dokumen ke dalam kelas yang berbeda
● Text Classification ● Dapat
mengelompokan
dokumen-dokumen ke dalam kelas yang berbeda
● Penyampaian materi mengenai Text Classificatio n yang disertai dengan penyelesaian studi kasus ● Penyampaian Materi: 60 Menit ● Latihan dan penyelesaian studi kasus mengenai Text Classification: 90 menit ● Mahasiswa mampu mengelompok an dokumen-dokumen kedalam kelas yang berbeda dari studi kasus yang diselesaikan 5%
8. Evaluasi tengah semester : melakukan validasi hasil penilaian, evaluasi dan perbaikan proses pembelajaran berikutnya 15%
9. ● Memiliki kemampuan
mengelompokkan dokumen dengan teks yang mirip memiliki keterkaitan baik yang memiliki kesamaan semantik maupun kesamaan statistik ● Clustering ● Partitional Algorithm ● Hierarchical Algorithms ● Dapat melakukan proses clustering dokumen dengan menggunakan salah satu algoritma yang tersedia ● Penyampaian materi mengenai clustering dalam IR dengan disertai algoritma-algoritma yang tersedia di dalam proses clustering ● Penyampaian Materi: 60 Menit ● Latihan dan penyelesaian studi kasus mengenai Clustering: 90 menit ● Mahasiswa mampu mengelompok an dokumen-dokumen dengan menggunakan algoritma yang tersedia di dalam proses clustering 5% 10. ● Memiliki kemampuan
untuk meringkas informasi yang terdapat didalam sebuah dokumen sehingga menghasilkan suatu versi yang ringkas untuk pengguna informasi ● Peringkasan Teks ● Jenis Ringkasan ● Hasil Ringkasan ● Dapat melakukan proses penyaringan informasi yang paling penting dari suatu sumber (atau beberapa sumber) untuk
menghasilkan suatu versi yang ringkas untuk user.
● Penyampaian materi dan juga latihan melakukan proses peringkasan teks dari beberapa dokumen ● Penyampaian Materi: 60 Menit ● Latihan dan penyelesaian studi kasus mengenai Text Summarization: 60 menit ● Diskusi kelompok hasil dari peringkasan teks: 60 menit ● Mahasiswa dapat melakukan text summarization dari dokumen-dokumen yang tersedia 5% 11. ● Memiliki kemampuan untuk memformulasikan dan menerapkan Question Answering System (QAS) untuk mengevaluasi pemrosesan teks ● Definisi QAS ● QA vs Search Engine ● Pengembangan QAS ● Definisi Passages ● Dapat menjelaskan QAS dan menerapkan QAS didalam bagian dari sebuah pemrosesan teks ● Simulasi dari penerapan QAS ● Penyampaian materi QAS: 60 menit ● Latihan dan simulasi QAS: 90 menit ● Mahasiswa dapat memahami dan penerapan dari QAS 5%
12. ● Memiliki kemampuan dalam menganalisa
kemungkinan-lemungkinan yang muncul dari hasil pemrosesan teks untuk memastikan kebutuhan user ● Probabilistic relevance feedback ● Probability Ranking Principle ● Binary Independence Model ● Dapat memahami mengenai Probabilistic relevance feedback serta memberikan contohnya ● Studi Kasus penerapan Probabilistic relevance feedback ● Diskusi kelompok: 60 menit ● Penyelesaian studi kasus: 90 menit ● Mahasiswa dapat memiliki wawasan baru mengenai Probabilistic relevance feedback dan dapat menerapkanny a didalam studi kasus yang sudah diberikan 5% 13. ● Memiliki kemampuan
dalam membaca dan menginterpretasikan informasi dan menggabungkannya dengan informasi pada bahasa-bahasa lain ● Cross-Language Information Retrieval (CLIR) ● Monolingual vs CLIR ● Dokumen vs Query ● Metode Penterjemahan ● Mengimplementasi kan dasar dari mesin penterjemah sehingga hasil akan baik jika query ditulis dalam kalimat sesuai dengan tata bahasa yang baik ● Studi kasus penerapan CLIR dengan bebrapa metode penterjemaha n ● Penyampaian materi: 60 menit ● Studi kasus tentang CLIR: 90 menit ● Mahasiswa dapat menerapkan konsep CLIR dengan menggunakan beberapa metode penterjemahan yang tersedia 5% 14. ● Memiliki kemampuan
dalam memahami web search dan search engine sebagai bagian dalam Information Retrieval ● Dasar dan komponen Web Search ● Markov chain ● Mendefisikan dan memberikan contoh proses dari Web Search dsn Search Engine ● Penyampaian materi mengenai Web Search dan Search Engine ● Penyampaian materi: 90 menit ● Tanya jawab: 60 menit ● Mahasiswa dapat menjelaskan penggunaan Web Search dan dapat membedakann ya dengan Search Engine 5%
15. ● Mahasiswa dapat mengerti tugas yang akan dikerjakan
● Final Project Information Retrieval
● Menyelesaikan tugas akhir mata kuliah Information Retrieval ● Presentasi kelompok dengen ketentuan: ● Slide 1: sekilah tentang topik yang di ambil ● Slide 2: Ruang lingkup dan batasan ● Slide 3: Arsitektur sistem yang dibuat ● Slide 4: pembagian tugas setiap anggota ● Demo sisem ● Presentasi dan penilaian: 150 menit ● Mahasiswa mampu menbuat arsitektur sistem dari Information Retrieval serta mendemokann ya 5%