PERANCANGAN EMAIL CLIENT DENGAN PENGKLASIFIKASIAN EMAIL MENGGUNAKAN
ALGORITMA VECTOR SPACE MODEL
SKRIPSI
MOSES CHRISTIAN 081402050
PROGRAM STUDI TEKNOLOGI INFORMASI
FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI UNIVERSITAS SUMATERA UTARA
MEDAN
2013
PERANCANGAN EMAIL CLIENT DENGAN
PENGKLASIFIKASIAN EMAIL MENGGUNAKAN ALGORITMA VECTOR SPACE MODEL
SKRIPSI
Diajukan untuk melengkapi tugas dan memenuhi syarat mencapai gelar Sarjana Teknologi Informasi
MOSES CHRISTIAN 081402050
PROGRAM STUDI TEKNOLOGI INFORMASI
FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI UNIVERSITAS SUMATERA UTARA
MEDAN
PERSETUJUAN
Judul : PERANCANGAN EMAIL CLIENT DENGAN
PENGKLASIFIKASIAN EMAIL MENGGUNAKAN
ALGORITMA VECTOR SPACE MODEL Kategori : SKRIPSI
Nama : MOSES CHRISTIAN Nomor Induk Mahasiswa : 081402050
Program Studi : SARJANA (S1) TEKNOLOGI INFORMASI Departemen : TEKNOLOGI INFORMASI
Fakultas : ILMU KOMPUTER DAN TEKNOLOGI INFORMASI
UNIVERSITAS SUMATERA UTARA
Diluluskan di Medan,
Komisi Pembimbing :
Pembimbing 2 Pembimbing 1
M. Umar S Tjkroaminoto, ST M.Fadly Syahputra Bsc, M.Sc.IT NIP.196206242006041015 NIP. 198301292009121003
Diketahui/Disetujui oleh
Program Studi S1 Teknologi Informasi Ketua,
Prof. Dr. Opim Salim Sitompul NIP. 196108171987011001
PERNYATAAN
PERANCANGAN EMAIL CLIENT DENGAN PENGKLASIFIKASIAN EMAIL MENGGUNAKAN ALGORITMA VECTOR SPACE MODEL
SKRIPSI
Saya mengakui bahwa skripsi ini adalah hasil kerja saya sendiri, kecuali beberapa kutipan dan ringkasan yang masing masing disebutkan sumbernya.
Medan,
MOSES CHRISTIAN 081402050
PENGHARGAAN
Puji dan syukur hanya bagi Tuhan Yang Maha Esa yang mengizinkan penulis dapat menyelesaikan skripsi ini. Sebab kasihNya yang besar dan kesetiaanNya yang tak pernah padam.
Ucapan terima kasih penulis sampaikan kepada Bapak M. Fadly Putra,B.Sc.M.Sc.IT dan Bapak M. Umar S Tjokroaminoto, ST selaku pembimbing pada penyelesaian skripsi ini yang telah memberikan panduan dan penuh kepercayaan kepada penulis untuk menyempurnakan kajian ini. Ucapan terima kasih juga penulis sampaikan kepada Bapak Baihaqi Siregar, Ssi.,MT. dan Bapak Romi Fadillah Rahmat, B.Comp.Sc,M.Sc selaku dosen penguji. Panduan ringkas, padat, dan profesional telah diberikan kepada penulis agar dapat menyelesaikan tugas ini.
Ucapan terima kasih juga ditujukan kepada Ketua dan Sekretaris Program Studi Teknologi Informasi, Prof. Dr. Opim Salim Sitompul, M.Sc dan Drs. Sawaluddin, M.IT, Dekan dan Pembantu Dekan Fakultas Ilmu Komputer dan Teknologi Informasi Sumatera Utara, semua dosen dan pegawai pada Program Studi Teknologi Informasi .
Tidak terlupakan penulis mengucapkan terima kasih kepada Ayahanda Drs.
Persadaan Ginting, Ibunda Dra. Krisnpenti Sembiring, adik-adik tercinta Dody dan Dea yang selalu memberikan cinta kasihnya dan dukungannya baik material dan spiritual dan yang berjasa memberikan dorongan kepada penulis selama menyelesaikan skripsi ini. Sahabat-sahabat saya Ilham Akbar, Shugy Sitepu , Pangeran David, Andryan , Harigo yang selalu memberi semangat dan terima kasih untuk doa-doa kalian. Semoga Tuhan Yang Maha Esa memberikan karunia kepada semua pihak yang telah memberikan bantuan, perhatian dan dukungan kepada penulis dalam menyelesaikan skripsi ini.
ABSTRAK
Pada zaman teknologi sekarang ini, email banyak digunakan untuk mengirim informasi keseluruh dunia ini. Selama ini pengklasifikasian pada email masih dilakukan secara manual dan kurang objektif. Maka dalam penelitian ini, penulis menerapkan Metode Vector Space Model (VSM) untuk membuat suatu pengklasifikasian email secara otomatis dan lebih objektif. Dengan metode ini pengklasifikasian email dapat dilakukan secara otomatis berdasarkan address, subject, dan body dari sebuah email sehingga memudahkan pengguna email dalam pengorganisasian setiap email yang masuk kedalam inbox pengguna fasilitas email.
Sehingga aplikasi ini nantinya akan memberi kemudahan bagi user pengguna email dalam mengklasifikasikan email sesuai dengan kata kunci dan jenis field yang ada.
Kata kunci : Email, Pengklasifikasian, Text Mining, Vector Space Model.
DESIGN EMAIL CLIENT CLASSIFICATION USING VECTOR SPACE MODEL ALGORITHM
ABSTRACT
On today's age of technology, widely used email to send information throughout the world. During the classification of the email is still done manually and less objective.
So in this study, the authors apply the method of Vector Space Model (VSM) to make an automatic email classification and more objective. With this method of email classification can be done automatically based on address, subject, and body of an email that allows users to email in the organization of every incoming email into a user's inbox email facility. So this application will provide convenience for the user email users in the email classify according to keyword and type of existing fields.
Keywords: Clasification, Text Mining, Vector Space Model, Email
DAFTAR ISI
Halaman
Persetujuan ii
Pernyataan iii
Penghargaan iv
Abstrak v
Abstract vi
Daftar Isi vii
Daftar Tabel ix
Daftar Gambar x
Bab 1 Pendahuluan 1.1 Latar Belakang 1
1.2 Rumusan Masalah 3
1.3 Batasan Masalah 3
1.4 Tujuan Penelitian 3
1.5 Manfaat Penelitian 4
1.6 Metode Penelitian 4
1.7 Sistematika Penulisan 5
Bab 2 Landasan Teori 2.1 Email 7
2.1.1 Latar Belakang Email 8
2.1.2 Sejarah Penggunaan Email 9
2.1.3 Mail Client 10
2.1.4 Sistem Penerimaan Email 11
2.2 Klasifikasi 15
2.3 Text Mining 16
2.4 Ekstrasi Dokumen 17
2.5 Model Ruang Vector 20
2.6 Ukuran Kemiripan 20
2.7 Pemrograman Visual Basic 24
2.8 Penelitian Sebelumnya 25
Bab 3 Analisis dan Perancangan
3.1 Analisis Aplikasi 26
3.1.1 Analisis Data 26
3.1.2 Spesifikasi Aplikasi 26
3.1.3 Spesifikasi Pengguna 27
3.1.4 Lingkungan Operasi 27
3.1.5 Deskripsi Aplikasi 27
3.2 Perancangan Aplikasi 30
3.2.1 Ekstraksi Dokumen 30
3.2.2.1 Case Folding 30
3.2.1.2 Tokenizing 30
3.2.2 Analisa 31
3.2.2.1 Algoritma TF/IDF (Term frequency – Inversed Document Frequency) 32 3.2.2.2 Cosine Similarity 34
3.2.3 Use Case Diagram 36
3.2.4 Activity Diagram 41
3.3 Perancangan Antar Muka 45
3.3.1 Menu Utama 45
3.3.2 Menu Email 46
3.3.3 Menu Sub Email 47
3.3.4 Menu Klasifikasi 47
Bab 4 Implementasi dan Pengujian 49
4.1 Implementasi 49
4.2 Pengujian 49
4.2.1 Tabel Pada Access 50
4.2.2 Tampilan Awal Sistem 51
Bab 5 Kesimpulan dan Saran 62
5.1 Kesimpulan 62
5.2 Saran 62
Daftar Pustaka 63
LAMPIRAN A: Listing Program 65
DAFTAR TABEL
Halaman
Tabel 2.1 Kelebihan dan Kekurangan Surat, Telepon, dan Email 9
Tabel 2.2 Perbedaan POP dan Web Based Email 12
Tabel 2.3 Penelitian Sebelumnya 25
Tabel 3.1 Tabel Dokumentasi Naratif Usecase Klasifikasi Email 37
Tabel 3.2 Tabel Dokumentasi Naratif Usecase View List Email 38
Tabel 3.3 Tabel Dokumentasi Naratif Usecase Klasifikasi 39
Tabel 3.4 Tabel Dokumentasi Naratif Usecase Send Email 40
Tabel 4.1 Tabel Download 50
Tabel 4.2 Tabel Classified 51
Tabel 4.3 Tabel Perhitungan TF/IDF 58
Tabel 4.4 Tabel Perhitungan Vector Space Model 59
DAFTAR GAMBAR
Halaman
Gambar 2.1 Cara Kerja Email 7
Gambar 2.2 Sistem Penerimaan Email 11
Gambar 2.3 Contoh Web Based Email dan Email Client 12 Gambar 2.4 Email Server 13
Gambar 2.5 SMTP Server 14
Gambar 2.6 Proses Pre-Processing Text 17
Gambar 2.7 Proses Case Folding dan Tokenizing 18
Gambar 2.8 Proses Filtering 18
Gambar 2.9 Proses Stemming 19
Gambar 2.10 Contoh Model Ruang Vector dengan dua dokumen D1 dan D2, serta Query Q1 21 Gambar 2.11 Contoh matriks term-document untuk database dengan dokumen dan t term 21 Gambar 2.12 Contoh Perhitungan bobot tf-idf 23
Gambar 3.1 Proses Processing 28
Gambar 3.2 Diagram Alir Analisa Konten 29
Gambar 3.3 Proses Case-folding dan Tokenizing 31
Gambar 3.4 Diagram Alir Pembobotan tf-idf 32
Gambar 3.5 Diagram Alir Pembobotan tf-idf 33
Gambar 3.6 Analisa tf/idf 34
Gambar 3.7 Vector Space Model 35
Gambar 3.8 Usecase Diagram Aplikasi klasifikasi Email 36
Gambar 3.9 Activity Diagram Menu Utama 41
Gambar 3.10 Activity Diagram Menu Pilihan Email 42
Gambar 3.11 Activity Diagram Menu Menu Filter 43
Gambar 3.12 Activity Diagram Menu Submenu Send Email 44
Gambar 3.16 Rancangan Antar muka menu utama 45
Gambar 3.17 Rancangan Antar muka menu email 46
Gambar 3.18 Rancangan Antar muka send email 47
Gambar 3.19 Rancangan Antar muka menu filter 48
Gambar 4.1 Tampilan Awal Sistem 52
Gambar 4.2 Tampilan Sub Menu Email 52
Gambar 4.3 Login_ Form 53
Gambar 4.4 Tampilan Form not accepted 54
Gambar 4.5 Tampilan Complete Input 54
Gambar 4.6 Tampilan Welcome 54
Gambar 4.7 Tampilan Send Email 55
Gambar 4.8 Tampilan Submenu classification 56
Gambar 4.9 Tampilan Filtering_Form 56
Gambar 4.10 Tampilan Filtering_Form berdasarkan field 57
Gambar 4.11 Tampilan Klasifikasi Berdasarkan Key dan Jenis Field 57
Gambar 4.12 Content_Form 61