• Tidak ada hasil yang ditemukan

ANALISIS SPAM FILTERING MENGGUNAKAN METODE NAIVE BAYESIAN DAN ITERATIVE DICHOTOMISER 3.

N/A
N/A
Protected

Academic year: 2017

Membagikan "ANALISIS SPAM FILTERING MENGGUNAKAN METODE NAIVE BAYESIAN DAN ITERATIVE DICHOTOMISER 3."

Copied!
2
0
0

Teks penuh

(1)

BAB I PENDAHULUAN

1.1 Latar Belakang

Spam yang masuk ke kotak masuk e-mailsangat terasa dengan semakin banyaknya memori penyimpanan yang terpakai yang menyebabkan kinerja komputer menjadi terasa lambat. Terlebih apabila mengunduh dahulu seluruh e-mail yang terdapat dalam inbox ke memori penyimpanan menggunakan mail client. Hal yang demikian akan merepotkan pengguna dalam memilah e-mail mana yang benar-benar penting. Karena banyaknya jumlah yang masuk maka tidak mungkin

menghapus secara manual.Dari situlah dibuat system filterisasi.

Proses filterisasi e-mail sudah sering diaplikasikan menggunakan algoritma Bayesian Chi-Square maupun Naïve Bayesian. Dua algoritma diatas menggunakan perhitungan probabilitas

yang disebut-sebut mempunyai keunggulan dalam tingkat akurasi yang baik dan minim-nya error rate.Metode filterisasi ini memiliki dasar perhitungan secara matematis untuk mengklasifikasikan e-mail berdasarkan kata, frasa dan domain yang terdapat di dalamnya (Sahami, 1998).

Di beberapa penelitian juga pernah menggunakan algoritma ID3 sebagai metode filterisasi e-mail. Hasil yang dihasilkan pun menunjukkan angka akurasi yang baik bahkan lebih baik dibandingkan metode Naïve Bayesian.Hanya saja dalam bentuk simulasi yang lingkungannya sangat berbeda dengan yang sebenarnya (Hendayun, 2013). Atas dasar tersebut, pada penelitian ini dua algoritma: Naïve Bayesian dan ID3 akan dibandingkan untuk menemukan mana yang lebih baik dengan cara menguji pada lingkungan yang sama dengan cara mengimplementasikan pada aplikasi SpamAssassin yang diintegrasikan pada e-mail client.

1.2 Rumusan Masalah

Berdasarkan latar belakang yang telah diuraikan diatas, permasalahan yang akan dibahas pada penelitian ini adalah membandingkanketepatan algoritma Naïve Bayesian dan ID3 dalam memisahkan e-mail yang berupa spam dengan non-spam ketika e-mail diunduh ke dalam memori penyimpanan lalu menganalisa ketepatan dari kedua algoritma.

1.3 Batasan Masalah

Batasan masalah dalam penelitian ini antara lain agar dalam penelitian ini dapat mencapai sasaran dan tujuan yang diharapkan, maka permasalahan dibatasi sebagai berikut :

a. Pengklasifikasian e-mail spam hanya dalam bentuk bahasa inggris dan tidak melakukan pengecekan pada konten attachment.

(2)

sehingga berapa pun nilai yang keluar pada hasil akhir akan dijadikan kesimpulan.

c. Dataset yang digunakan sudah dikondisikan dengan cara menyeimbangkan jumlah data spam dan non spam sebelum dilakukan pengujian untuk memudahkan analisa perhitungan.

1.4 Tujuan Penelitian

Tujuan dari penelitian ini adalah membandingkan algoritma yang memiliki performa ketepatan lebih baik antara algoritma Naïve Bayesian dengan ID3 ketika diintegrasikan dengan e-mail client.

1.5 Manfaat Penelitian

Adapun manfaat dari penelitian ini adalah menghemat waktu dan mempermudah pekerjaan bagi pengguna layanan e-mail untuk mengelola isi kotak masuknya sehingga tidak perlu kesusahan dalam memilah-milah e-mail spam maupun non spam.

1.6 Sistematika Penulisan

Sistematika penulisan penelitian ini terdiri dari lima bab yaitu : BAB I PENDAHULUAN

Bab ini berisi Latar Belakang Masalah, Rumusan Masalah, Batasan Masalah, Tujuan penelitian, Manfaat Penelitian, dan Sistematika Penulisan

BAB II TINJAUAN PUSTAKA

Bab ini memuat dasar teori dan penelitian terkait yang digunakan untuk dasar pembahasan dari penelitian.

BAB III METODOLOGI PENELITIAN

Bab ini berisi metode atau langkah-langkah pemecahan masalah yang digunakan dalam penelitian.

BAB IV HASIL DAN PEMBAHASAN

Bab ini berisi hasil dan pembahasan dari percobaan pengklasifikasian spam dengan algoritma Naïve Bayesian dan ID3.

BAB V PENUTUP

Referensi

Dokumen terkait

Puji syukur penulis panjatkan kehadirat Allah Subhanahu Wa Ta’ala yang senantiasa memberikan nikmat dan karunia-Nya sehingga penulis dapat menyelesaikan skripsi dengan

Dalam subbab ini akan dijelaskan mengenai setting dari qmail server sehingga dapat berfungsi sebagai mail gateway serta setting dari qmail sehingga dapat

Hasil dari penelitian ini menunjukkan bahwa pada proses testing, sistem melakukan supervised- learning menggunakan algoritma Naive Bayesian Classifier dengan tingkat

Berdasarkan hasil penelitian yang telah dilakukan, ditemukan bahwa algoritma Naïve Bayes menggunakan fitur N-gram telah berhasil melakukan klasifikasi sangat baik dengan

Dari hasil penelitian ini telah berhasil dibangun sebuah model untuk melakukan deteksi surel Spam dan non Spam berbahasa Indonesia dan Algoritma Naïve Bayes

Dari hasil pengujian aplikasi dapat disimpulkan bahwa: (1) Aplikasi ini menggunakan algoritma ID3 untuk menentukan status obesitas pada anak sesuai dengan standar tabel gizi

Dalam penelitian ini dilakukan pengklasifikasian teks mining dan pengujian model dengan membandingkan metode algoritma Naïve Bayes, SVM, Random Forest dan

Secara singkat, algoritma naïve bayes classification adalah diprediksinya semua probabilitas untuk pengklasifikasian sekumpulan data algoritma yang sering digunakan karena dapat