SISTEM SMS SPAM DETECTOR UNTUK SMS BERBAHASA
INDONESIA PADA SMARTPHONE ANDROID
KARIMUL MAKHTIDI
DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
SISTEM SMS SPAM DETECTOR UNTUK SMS BERBAHASA
INDONESIA PADA SMARTPHONE ANDROID
KARIMUL MAKHTIDI
Skripsi
sebagai salah satu syarat untuk memperoleh gelar
Sarjana Komputer pada
Departemen Ilmu Komputer
DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
ABSTRACT
KARIMUL MAKHTIDI. SMS Spam Detector System For Indonesian SMS On Android Smartphone. Supervised by HARI AGUNG ADRIANTO.
Nowadays, the presence of SMSs that indicate fraud acts is rising and very disturbing. Those SMSs often use unsuspicious sentences, so that people maybe misleaded. Several algorithms have been studied to find the SMS patterns that indicate the presence of fraud, hoax, and advertisement. The pattern was then used to filter the next incoming SMS spam. Naïve Bayes algorithm is one of the most effective approaches used in filtering techniques. Therefore, this research implements this method on Android smartphone to prevent SMS spam from reaching their destination. Several SMSs that contain fraud, hoax, and advertisement were used to test the application. It was found that the proposed application can detect and classify SMS spam with 100% accuracy on the testing dataset.
Judul Skripsi : Sistem SMS Spam Detector untuk SMS Berbahasa Indonesia pada Smartphone Android
Nama : Karimul Makhtidi
NRP : G64080086
Menyetujui: Pembimbing
Hari Agung Adrianto, S.Kom, M.Si NIP. 19760917 200501 1 001
Mengetahui:
Ketua Departemen Ilmu Komputer
Dr. Ir. Agus Buono, M.Si, M.Kom NIP. 19660702 199302 1 001
KATA PENGANTAR
Segala puji bagi Allah subhanahu wata’ala atas segala limpahan rahmat serta karunia-Nya sehingga penulis mampu menyelesaikan penelitian ini dengan baik. Shalawat dan salam penulis sampaikan kepada Nabi Muhammad shallallahu ‘alaihi wasallam serta kepada keluarganya, sahabatnya, serta para pengikutnya yang selalu berpegang kepada Al-Quran dan As-Sunnah. Penulis juga menyampaikan terima kasih kepada seluruh pihak yang telah berperan dalam penelitian ini, yaitu: 1 Ayahanda Abdul Aziz, Ibunda Muhimah, serta Adik Mochamad Wildan, Khasin Sobanuari, dan Khirzudin Febriansyah atas doa, kasih sayang, dukungan, serta motivasi kepada penulis untuk penyelesaian penelitian ini.
2 Bapak Hari Agung Adrianto, S.Kom, M.Si selaku dosen pembimbing yang telah memberi banyak ide, saran, bantuan, serta dukungan sampai selesainya penelitian ini.
3 Ibu Annisa, S.Kom, M.Kom dan Dr.Eng. Taufik Djatna, S.TP, M.Si yang telah bersedia menjadi penguji.
4 Rekan-rekan seperjuangan di Ilmu Komputer IPB angkatan 45 atas segala kebersamaan, bantuan, dukungan, serta kenangan bagi penulis selama menjalani masa studi. Semoga kita bisa berjumpa kembali kelak sebagai orang-orang sukses.
5 Rekan-rekan satu bimbingan, Mitha Rahmawati, Sri Rahayu, dan Cut Wina Crisana semoga lancar dalam melanjutkan penelitiannya.
6 Candra Wangsa Setiadipura, Laras Mutiara Diva, Fanny Risnuraini, Arif Nofyan Syah, dan Huswantoro Anggit yang telah membuat aplikasi Anti SMS Spam.
7 Rekan-rekan satu kontrakan, Tri, Rama, Anas, Fakih, dan Arif atas kebersamaan dan dukungannya selama ini.
8 Rekan-rekan Microsoft Fasttrack 2 dan juga rekan-rekan kerja di PT Navcore Nextology atas dukungan dan kerjasamanya.
9 Masyarakat Internet penghuni milis serta jejaring sosial yang telah melakukan uji coba dan memberikan masukan.
Penulis berharap penelitian ini dapat memberikan manfaat, khususnya bagi pengguna Android di Indonesia dan masyarakat pada umumnya.
Bogor, September 2012
RIWAYAT HIDUP
Penulis dilahirkan di Pekalongan, Jawa Tengah pada tanggal 1 April 1990. Penulis merupakan anak pertama dari pasangan Abdul Aziz dan Muhimah. Pada tahun 2008, penulis menamatkan pendidikan di SMA Negeri 1 Kedungwuni, Kabupaten Pekalongan. Penulis lulus seleksi masuk Institut Pertanian Bogor (IPB) pada tahun yang sama melalui jalur Undangan Seleksi Masuk IPB dan diterima sebagai mahasiswa di Departemen Ilmu Komputer, Fakultas Matematika dan Ilmu Pengetahuan Alam.
DAFTAR ISI
Halaman
DAFTAR ISI ... v
DAFTAR TABEL ... vi
DAFTAR GAMBAR ... vi
DAFTAR LAMPIRAN... vi
PENDAHULUAN Latar Belakang ... 1
Tujuan ... 1
Ruang Lingkup ... 1
TINJAUAN PUSTAKA Android ... 2
SMS Spam ... 2
Klasifikasi ... 2
Text Mining ... 3
Algoritme Naïve Bayes ... 3
Evaluasi Klasifikasi SMS ... 3
METODE PENELITIAN Penelitian Terkait ... 4
Perancangan Praprosess Sistem ... 4
Perancangan Klasifier Sistem... 4
Perancangan Antarmuka Sistem ... 4
Pengembangan Sistem ... 4
Pengujian Sistem ... 5
Lingkungan Implementasi ... 5
HASIL DAN PEMBAHASAN Deskripsi Singkat Sistem ... 5
Perancangan Praproses Sistem ... 5
Tokenisasi ... 5
Hapus Stopwords ... 6
Stemming ... 6
Perancangan Klasifier Sistem... 6
Perancangan Antarmuka Sistem ... 7
Pengembangan Sistem ... 8
Pengujian Sistem ... 10
KESIMPULAN DAN SARAN Kesimpulan ... 11
Saran ... 11
DAFTAR PUSTAKA ...11
LAMPIRAN ...12
DAFTAR TABEL
Halaman
1 Desain tabel spam ... 8
2 Desain tabel whitelist ... 8
3 Desain tabel blacklist ... 8
4 Fungsionalitas tombol pada SMS popup ... 9
5 Hasil klasifikasi ... 11
DAFTAR GAMBAR
Halaman 1 Arsitektur Android. ... 22 Tahapan Penelitian. ... 4
3 Diagram alir proses pada sistem. ... 5
4 Diagram alir algoritme stemming. ... 6
5 Rancangan tampilan sistem. ... 7
6 Penerapan HashMap untuk key-value kategori spam ... 8
7 Penerapan HashMap untuk key-value kategori nonspam ... 8
8 Tampilan SMS popup. ... 9
9 Tampilan menu Pilihan. ... 9
10 Tampilan menu spam. ... 10
11 Tampilan review blocked SMS ... 10
12 Tampilan menu Izinkan ... 10
13 Tampilan menu Blokir. ... 10
DAFTAR LAMPIRAN
Halaman 1 Contoh macam-macam jenis data SMS untuk data latih... 132 Reprentasi data SMS dalam bentuk XML ... 14
3 Contoh hasil tahap data latih ... 15
4 Sequence diagram sistem ... 16
5 Data uji SMS spam ... 17
PENDAHULUAN
Latar Belakang
Sekarang ini, Short Message Service atau SMS merupakan media komunikasi yang paling sering digunakan. SMS seakan sudah melekat dengan aktivitas keseharian masyarakat. Selain mudah dan cepat, tarif yang semakin murah membuat masyarakat lebih gemar meng-gunakan SMS. SMS juga dimeng-gunakan sebagai layanan publik seperti SMS banking untuk mempermudah masyarakat dalam melakukan berbagai aktivitas perbankan.
Penggunaan SMS yang semakin luas ini dimanfaatkan oleh sebagian orang yang tidak bertanggung jawab untuk melakukan tindak kejahatan, seperti penipuan melalui SMS. Hanya dengan bermodal handphone dan pulsa, penipu dapat melakukan aksinya dengan mudah dan merasa lebih aman karena akan sulit dilacak. Maraknya aksi penipuan dewasa ini membuat masyarakat semakin resah. Bentuk tindak penipuan melalui SMS ini sangat beragam sehingga sulit untuk dibedakan oleh masyarakat awam. Salah satu yang saat ini marak di masyarakat adalah SMS yang berisi permintaan pulsa telepon seluler ke nomor tertentu, dengan mengatasnamakan orangtua, yaitu mama atau papa.
SMS penipuan yang beredar luas di masyarakat cenderung memiliki pola tertentu. Hanya saja masyarakat tidak banyak mengetahui sehingga tertipu oleh SMS tersebut. Dengan mengenali pola ini, masyarakat dapat lebih berhati-hati dalam menindaklanjuti SMS yang diterima sehingga kejahatan melalui SMS ini dapat dihindari.
Palupiningsih (2011) mencoba menganalisis pola dalam SMS untuk memprediksi apakah berindikasi tindak penipuan menggunakan algoritme Naïve Bayes dan C4.5. Dari penelitian tersebut diketahui Naïve Bayes lebih baik daripada C4.5. Hal ini sejalan dengan Mahmoud & Mahfouz (2012) yang menyatakan bahwa
Naïve Bayes sendiri merupakan salah satu algoritme yang paling efektif digunakan untuk mengklasifikasikan dokumen teks. Naïve Bayes
juga sederhana serta memiliki komputasi yang ringan sehingga relatif mudah untuk diimplementasikan pada smartphone Android.
Penelitian ini merupakan penelitian lanjutan dari penelitian Palupiningsih (2011) dengan mengimplementasikan model klasifikasi Naïve Bayes yang telah dihasilkan dan juga melanjutkan pengembangan aplikasi Anti SMS
Spam yang dibuat oleh Setiadipura. Model
klasifikasi ini diimplementasikan pada platform
Android mulai dari versi 2.1 sampai dengan versi 4.0.3. Dengan pangsa pasar Android di Indonesia yang mencapai 52% di Q1 tahun 2012 (IDC 2012), diharapkan aplikasi ini dapat membantu pengguna Android dalam menyaring SMS yang masuk ke smartphone-nya sehingga dapat mengurangi risiko dari SMS spam.
Aplikasi untuk mendeteksi SMS spam
berbahasa Indonesia di smartphone Android sebenarnya sudah ada. Aplikasi itu adalah smsBlocker. Namun aplikasi tersebut dibuat oleh perusahaan asal India, yaitu Optinno Mobitech Pvt. Ltd. Secara garis besar aplikasi ini dapat mendeteksi SMS spam berbahasa Indonesia, namun untuk kasus SMS penipuan yang lebih spesifik belum terdeteksi, seperti penipuan SMS keikutsertaan seminar dari lembaga tertentu dan SMS yang menunjukkan ketertarikan pada proses jual beli tanah, rumah, atau mobil. smsBlocker ini ada dua jenis versi, yaitu versi gratis dan versi premium. Untuk versi gratis, aplikasi ini akan menampilkan iklan ketika terhubung ke internet dan mematikan bebarapa fitur. Untuk mengaktifkan fitur-fitur tersebut dan menghilangkan iklan pengguna harus membayar sebesar US$4.25.
Tujuan
Tujuan penelitian ini, yaitu:
1 Mengimplementasikan algoritme Naïve Bayes pada sistem SMS spam detector
untuk smartphone Android versi 2.1 sampai versi 4.0.3.
2 Membangun sistem SMS spam detector
yang dapat mendeteksi SMS berbahasa Indonesia baik baku maupun tidak baku. 3 Mengukur kinerja sistem SMS spam
detector berbasis algoritme Naïve Bayes.
Ruang Lingkup
Ruang lingkup penelitian yang dilakukan adalah menggunakan model klasifikasi Naïve Bayes untuk data SMS berbahasa Indonesia yang beredar di masyarakat pada bulan Agustus 2010 – Juni 2012. Indikasi tindak penipuan dan
TINJAUAN PUSTAKA
Android
Android adalah sebuah open source software toolkit untuk perangkat bergerak yang dibuat oleh Google yang mencakup sistem operasi, middleware dan key applications. Android SDK menyediakan tool dan API (Application Programming Interface) yang diperlukan untuk mulai mengembangkan aplikasi pada platform Android menggunakan bahasa pemrograman Java. Berikut adalah arsitektur dari Android (Burnette 2008) yang ditunjukan pada Gambar 1.
Berikut adalah penjelasan arsitektur Android pada Gambar 1:
1 Linux Kernel
Pada Android, Linux Kernel merupakan
core services yang menangani hardware drivers, process dan memory management,
security, network, and power management. Pemakai telepon genggam berbasis Android tidak akan pernah melihat Linux, dan program tidak akan memanggil Linux secara langsung.
2 Native Libraries
Android memasukan libraries yang ada dalam C atau C++, serta digunakan untuk berbagai komponen dalam Android. Native libraries ini berjalan di atas Linux Kernel. 3 Android Runtime
Sejajar dengan native libraries terdapat
layer Android Runtime yang di dalamnya terdapat Dalvik virtual machine dan core
Java libraries. Dalvik virtual machine (VM) adalah implementasi Java pada Google, sangat optimal untuk mobiledevices. Semua kode yang ditulis untuk Android (dalam
Java) akan dijalankan dengan Dalvik VM. 4 Application Framework
Layer Application Framework terletak di atas native libraries dan layer runtime.
Layer ini menyediakan high-level blok yang nanti akan digunakan dalam pembuatan aplikasi.
5 Applications and Widgets
Application and Widgets adalah layer
tertinggi dalam arsitektur Android.
Application adalah program yang telihat pada layar interaksi user.
SMS Spam
Tidak ada definisi yang baku secara international dan konstitusi mengenai arti dari SMS spam (Androulidakis 2012). Beberapa negara memiliki definisi sendiri mengenai arti dari SMS spam. Namun intinya, SMS spam
adalah SMS yang tidak diinginkan oleh pihak penerima SMS. Contoh dari SMS spam adalah SMS penipuan, SMS ancaman, SMS promosi, dan lain-lain.
Klasifikasi
bersifat kategorik. Proses klasifikasi dibagi terbentuk diuji dengan sebagian data lainnya untuk mengetahui akurasi model tersebut. Jika akurasinya mencukupi maka model tersebut dapat dipakai untuk memprediksi kelas data yang belum diketahui (Han et al. 2012)
Text Mining
Text mining merupakan salah satu bidang interdisiplin yang menggabungkan antara temu kembali informasi, data mining, machine learning, statistik, dan komputasional linguistik. Sebagian besar informasi disimpan dalam bentuk teks, seperti artikel, berita, paper, dan lain sebagainya. Untuk itu, penelitian tentang
text mining sangat penting. Tujuan utama dari
text mining adalah mendapatkan informasi yang berkualitas dari teks.
Tugas khusus dari text mining diantaranya untuk kategorisasi teks, pengelompokan teks, konsep ekstraksi, dan peringkasan teks. Untuk melakukan kategorisasi teks terdapat berbagai algoritme. Salah satu algoritme yang cepat dan sederhana adalah algoritme Naïve Bayes (Han et al. 2012).
Algoritme Naïve Bayes
Naïve Bayes adalah metode Bayesian Learning yang paling cepat dan sederhana. Hal ini berasal dari teorema Bayes dan hipotesis kebebasan, menghasilkan klasifier statistik berdasarkan peluang. Ini adalah teknik sederhana, dan harus digunakan sebelum mencoba metode yang lebih kompleks. Peluang sebuah pesan d berada di kelas c, P c d , untuk mengukur berapa banyak bukti kontribusi bahwa c adalah kelas yang benar. Dalam klasifikasi email, kelas dari pesan ditentukan dengan menemukan maximum a posteriori
(MAP) kelas cmap paling mungkin yang didefinisikan oleh:
cmap=a g maxc c cs P c|d
=a g maxc c cs P c ∏ =1P tk|c (2)
Formula 2 melibatkan perkalian banyak peluang bersyarat, satu untuk masing-masing fitur, maka mengakibatkan perhitungan berada di underflow floating point. Dalam prakteknya, perkalian peluang sering dikonversi menjadi sebuah tambahan logaritma probabilitas dan karena itu, untuk memaksimalkan persamaan dapat menggunakan alternatif berikut
cmap=a g maxc c cs P c ∑ =1 P tk c (3) Semua parameter model, yaitu distribusi peluang kelas dan fitur, dapat diperkirakan dengan frekuensi relatif dari data latih D. Misalnya ketika kelas dan fitur pesan yang diberikan tidak terjadi bersama-sama di data latih, estimasi probabilitas berbasis frekuensi yang sesuai akan menjadi nol, yang akan membuat sisi kanan Formula 3 tidak terdefinisi. Masalah ini dapat diatasi dengan memasukkan beberapa koreksi seperti Laplace smoothing di semua probabilitas perkiraan, sehingga peluang masing-masing fitur dapat dihitung dengan persamaan berikut
vocabulary (Berry & Kogan 2010).
Evaluasi Klasifikasi SMS
Cara untuk mengukur kinerja dari suatu klasifier teks secara efektif terhadap suatu term
yaitu dengan mengukur recall (r) dan precision (p) (Berry & Kogan 2010). Jika jumlah keputusan yang true positive, false positive, dan
false negative dianggap sebagai tp, fp, dan fn,
merupakan pesan spam yang dianggap sebagai pesan yang sah.
METODE PENELITIAN
Mulai
Gambar 2 Tahapan penelitian.
Penelitian Terkait
Palupiningsih (2011) melakukan penelitian penggunaan algoritme C4.5 dan Naïve Bayes
untuk mengidentifikasi SMS spam dan membandingkan kinerja dari masing-masing algoritme. Dataset yang digunakan terdiri dari empat kategori. Kategori SMS 1 adalah SMS yang memiliki indikasi penipuan yang berisi penawaran menjadi agen pulsa. Kategori SMS 2 adalah SMS yang memiliki indikasi penipuan yang berisi ketertarikan pada kegiatan jual beli tanah, rumah, atau mobil. Kategori SMS 3 adalah SMS yang memiliki indikasi penipuan yang berisi permintaan pulsa telepon seluler ke nomor tertentu. Kategori SMS 4 adalah SMS yang tidak memiliki indikasi penipuan. SMS yang digunakan dalam dataset adalah SMS berbahasa Indonesia baik baku maupun tidak baku.
Terdapat tiga langkah yang dilakukan pada penelitiannya, yaitu praproses, seleksi fitur, dan representasi pesan. Langkah-langkah yang dilakukan pada tahap praproses, yaitu
tokenizing, filtering, dan stemming. Praproses ini bertujuan untuk mendapatkan token dari setiap pesan. Pada tahap seleksi fitur digunakan
information gain (IG). Pengalaman dalam klasifikasi pembelajaran berbasis teks adalah bahwa IG dapat mengurangi jumlah atribut, tanpa ada kerugian (atau bahkan beberapa perbaikan) akurasi. Setiap pesan
direpresentasi-kan dalam bentuk vektor numerik yang nantinya di gabungkan menjadi satu tabel. Sehingga tabel gabungan tersebut merupakan representasi kepemilikan fitur (token) dari semua pesan. Dari penelitian yang dilakukan dihasilkan model klasifikasi SMS berindikasi penipuan dengan menggunakan algoritme C4.5 dan Naïve Bayes. Selain itu, dari penelitian ini diketahui bahwa algoritme Naïve Bayes lebih dominan dibanding algoritme C4.5.
Perancangan Praprosess Sistem
Terdapat tiga langkah yang dilakukan pada tahap praproses, yaitu tokenizing, filtering, dan
stemming. Pada lagkah tokenizing, dilakukan pemotongan setiap kata yang terdapat dalam SMS. Karakter selain huruf yang terdapat dalam SMS akan dihilangkan. Setiap kata disebut sebagai token. Langkah selanjutnya adalah
filtering, dimana pada langkah ini dilakukan pembuangan stopwords. Yang termasuk ke dalam stopwords adalah yang, di, ke, dari, adalah, dan, atau, dan lain sebagainya. Setelah itu dilakukan langkah stemming, yaitu menghilangkan imbuhan atau akhiran yang terdapat pada token. Pada tahap ini akan dibuat rancangan praproses sistem sehingga tahap praproses dapat dilakukan secara otomatis oleh sistem.
Perancangan Klasifier Sistem
Klasifikasi merupakan bagian terpenting dalam sistem ini. Dalam tahap ini akan dibuat sistem klasifikasi menggunakan algoritme
Naïve Bayes. Dengan demikian sistem akan mampu menyaring SMS yang masuk dan kemudian memasukkan SMS tersebut ke dalam kelas spam atau tidak.
Perancangan Antarmuka Sistem
Perancangan antarmuka dilakukan dengan merancang tampilan pada platform Android dengan kombinasi warna, teks, dan gambar sesuai dengan isi dan tujuan pengembangan sistem. Selain itu dalam tahap ini sistem akan dirancang pula bagian interaksi manusianya sehingga dapat mudah dalam penggunaanya (user friendly).
Pengembangan Sistem
Tahap pengembangan sistem ini dimaksud-kan untuk menggabungdimaksud-kan, mengimplementasi-kan, dan mengintegrasikan tahapan sebelumnya yang sudah dilakukan supaya menjadi satu kesatuan sistem yang siap digunakan. Pemilihan
kode sehingga kode menjadi terstruktur dan memudahkan untuk dikembangkan pada penelitian selanjutnya.
Pengujian Sistem
Pengujian terhadap sistem dilakukan dengan mengevaluasi precision dan recall dari kinerja klasifikasi yang dihasilkan. Dengan menggunakan precision dan recall ini, dapat dilakukan akurasi dari hasil klasifikasi sehingga dapat diketahui efektivitas kinerja dari algoritme Naïve Bayes.
Lingkungan Implementasi
Lingkungan implementasi yang digunakan adalah sebagai berikut:
Perangkat lunak:
Microsoft Windows 7 Professional,
Android SDK r18,
Eclipse Indigo,
Android Development Toolkit versi 20.0.0, dan
SQlite Database. Perangkat keras:
prosesor Intel Core i7 @1.73 GHz,
memori 4 GB,
hard disk 500 GB, dan
Sony Ericsson Xperia Neo V.
HASIL DAN PEMBAHASAN
Deskripsi Singkat Sistem
Sistem SMS spam detector ini terbagi menjadi dua alur, yaitu alur offline dan alur
online. Alur offline adalah tahapan proses klasifikasi yang dilakukan diluar perangkat
mobile Android sedangkan alur online itu dilakukan di perangkat mobile atau emulator Android. Diagram alir proses pada sistem dapat dilihat pada Gambar 3.
Perancangan Praproses Sistem
Kelas yang dipakai dalam pengklasifikasi-an SMS ini ada dua macam, yaitu kelas
spam dan kelas nonspam. Tahapan dalam klasifikasi terdiri dari proses pengolahan data latih dan proses pengolahan data uji. Data latih yang digunakan sebanyak 148 dokumen SMS dengan SMS spam sebanyak 93 dokumen dan SMS nonspam sebanyak 55 dokumen. Seluruh dokumen SMS menggunakan Bahasa Indonesia, baik yang baku maupun yang tidak baku. Contoh berbagai data SMS untuk data
latih dapat dilihat pada Lampiran 1. Untuk memproses seluruh dokumen digunakan program dengan menggunakan bahasa pemrograman perl.
Tahap praproses data diawali dengan mengubah dokumen SMS (korpus) yang telah dikumpulkan ke dalam bentuk dokumen XML seperti yang terlihat pada Lampiran 2. Seluruh dokumen XML ini memiliki elemen root <SMS>, dengan elemen child <CLASS>, <ID>, dan <CONTENT>. Dokumen XML ini digunakan untuk praproses data yang meliputi tiga tahap, yaitu tokenisasi, hapus stopwords, dan stemming.
Tokenisasi
Seluruh korpus masuk ke dalam proses tokenisaasi untuk diambil token atau kata-kata yaitu kata yang dibatasi oleh whitespace dan semua karakter kecuali huruf dan angka, seperti: , . ? ! / ' " : ; & ( ) + - *. Selain itu dalam proses tokenisasi ini, kata-kata akan diubah dalam bentuk lowercase untuk menyeragamkan kata.
Hapus Stopwords mendapatkan kata dasar. Penentuan kata dasar juga mengacu kepada kamus kata dasar yang diperoleh dari KBBI (Kamus Besar Bahasa Indonesia) yang jumlah keseluruhan-nya 28 526 kata. Untuk mengetahui suatu kata terdapat pada KBBI, digunakan metode string matching, karena hasil tokenisasi dan kata dasar dalam KBBI sama-sama dalam bentuk
lowercase. Selain itu, dalam bahasa pemrograman perl dan Android terdapat fungsi untuk string matching sehingga prosesnya dapat lebih cepat. Berikut diagram alir dari algoritme
stemming, seperti yang terlihat pada Gambar 4.
Kata
Cek list kata dasar pada KBBI
Gambar 4 Diagram alir algoritme stemming.
Perancangan Klasifier Sistem
Setelah dilakukan praproses data diperoleh token dari setiap dokumen. Tahap berikutnya adalah pembobotan, pembobotan yang digunakan adalah pembobotan term frequency
atau tf. Pembobotan tf digunakan karena pada klasifikasi Naïve Bayes hanya dibutuhkan frekuensi dari kata-kata untuk mencari peluang
Bayes-nya.
Secara keseluruhan tahapaan klasifikasi pada tahap training ini dapat dilakukan sebagai
melakukan tokenisasi isiSMS dengan pemisah => ,.?!/:;&%()=-'"
simpan tiap pisahan kata yang diperoleh, untuk tiap kata:
- ubah menjadi huruf kecil
- jadikan NULL jika merupakan salah satu dari stopword => Regex
- stemming
- jika panjang string lebih dari 0, maka simpan kata ini (IDSMS, kata, frekuensi++) => matrix term frekuensi => termfrekuensi kata k di
3 Hitung jumlah seluruh kata dalam korpus:
untuk setiap SMS s:
- jika kelas s adalah spam maka (jumlah SMS di kelas spam )++.
untuk setiap kata k:
- jumlah kata di korpus += jumlah kata
k. (jumlah kata di korpus)).
- peluang kata k di kelas bukan spam (jumlah SMS di korpus).
- peluang SMS s di kelas bukan spam
- selainnya kelas SMS adalah BUKAN
SPAM.
Pada penelitian ini diperoleh 2474 kata unik beserta peluangnya dengan rincian 1237 untuk kelas spam dan 1237 untuk kelas nonspam. Hasil tersebut digunakan untuk menguji dokumen yang ada. Dari 55 dokumen yang termasuk ke dalam kelas nonspam didapat 55 dokumen yang termasuk dalam kelas nonspam
sedangkan dari 93 dokumen dari kelas spam
didapat 93 dokumen yang termasuk ke dalam kelas spam. Dengan demikian akurasi klasifikasi mencapai 100%.
Dari hasil tersebut, peluang dari tiap-tiap kata unik di masing-masing kelas akan digunakan sebagai data source dan hasil klasifikasi dari masing-masing SMS yang ada di dalam korpus digunakan sebagai pembanding pada tahap implementasi sistem di Android.
Perancangan Antarmuka Sistem
Antarmuka aplikasi pada perangkat mobile
sangat berbeda dengan antarmuka pada aplikasi
desktop maupun web. Antarmuka pada perangkat mobile harus didesain sangat sederhana namun juga tidak mengurangi kenyamanan pengguna. Masing-masing sistem operasi di perangkat mobile memiliki ciri khas yang berbeda, terutama Android. Pada penelitian ini, antarmuka sistem mencoba mengikuti guidelines UI dari Android dan secara garis besar terdiri atas menu dan konten. Untuk menu pada sistem ini menggunakan tab menu sedangkan tampilan konten menggunakan
ListView. Tab menu yang ada dalam aplikasi ini diantaranya Spam , Izinkan, Blokir, dan Pilihan.
ListView yang tampil akan disesuaikan dengan
tab menu yang sedang aktif. Menu Spam untuk menampilkan SMS spam yang di blok, menu Izinkan untuk menampilkan whitelist number, menu Blokir untuk menampilkan blacklist number dan menu Pilihan untuk menampilkan pengaturan dari aplikasi. Rancangan tampilan dari sistem ini dapat dilihat pada Gambar 5.
Gambar 5 Rancangan tampilan sistem. Tab Menu
Pengembangan Sistem
Pada tahap pengembangan sistem ini, seluruh tahapan dari mulai tokenisasi, buang
stopwords, dan stemming diadopsi dan diimplementasikan menggunakan bahasa pemrograman Android. Untuk setiap SMS yang masuk akan ditangkap dan dilakukan tahap yang sama dengan tahap offline sampai didapatkan kata-kata unik (token). Kemudian kata unik tersebut akan dicocokan dengan data source dan dihitung peluangnya untuk masing-masing kelas. Nilai peluang yang lebih besar akan dimasukkan ke dalam kelas tersebut. Data source ini direpresentasikan dalam bentuk
HashMap atau pasangan key-value sehingga mudah dalam mendapatkan peluang dari suatu kata unik. Berikut contoh penerapan HashMap
untuk key-value kategori spam dan nonspam
dalam pemrograman Android seperti yang terlihat pada Gambar 6 dan 7.
Gambar 6 Penerapan HashMap untuk key-value kategori spam
Gambar 7 Penerapan HashMap untuk key-value kategori nonspam
Setiap SMS yang dideteksi sebagai spam
akan disimpan dalam tabel spam yang terdapat di database nefron. Database ini dibuat menggunakan database engine yang sudah tertanam di sistem operasi Android, yaitu yang digunakan adalah long, karena pada sistem operasi Android, tanggaldanwaktu dari sebuah SMS direpresentasikan dalam bentuk
timestamp. Dari bentuk tersebut, dapat dikonversi ke dalam tanggal maupun waktu sekaligus. Selain tabel spam, ada pula tabel
blacklist dan whitelist untuk menyimpan nomor yang di blacklist dan nomor whitelist. Desain dari masing-masing tabel dapat dilihat pada Tabel 1, 2, dan 3.
Tabel 1 Desain tabel spam Field Tipe Keterangan _id integer Id SMS spam number text Nomor pengirim SMS message text Isi SMS
tanggal long Tanggal dan waktu SMS diterima
Tabel 2 Desain tabel whitelist Field Tipe Keterangan
_id integer Id nomor yang diizinkan (whitelist)
number text Nomor yang diizinkan (whitelist)
Tabel 3 Desain tabel blacklist Field Tipe Keterangan
_id integer Id nomor yang diblokir (blacklist)
number text Nomor yang diblokir (blacklist)
Dari ketiga tabel, hanya tabel spam yang dibuat triger dengan tujuan membatasi jumlah SMS spam yang disimpan di database. Dengan begitu, konsumsi memori dari sistem ini dapat diminimalkan. Jumlah SMS yang diperbolehkan disimpan di database hanya sebanyak 50 SMS. Jika lebih dari itu, maka sistem akan otomatis menghapus SMS spam terlama yang ada di
database.
Dalam implementasinya, aplikasi SMS spam detector ini tidak hanya mampu mendeteksi SMS spam secara otomatis, namun juga terdapat beberapa fitur tambahan, yaitu : 1 Review, delete dan restore blocked SMS:
inbox dengan menekan tombol Pindah Ke
Inbox jika terdapat salah klasifikasi.
2 Shake gesture untuk menghapus seluruh
blocked SMS: pengguna dapat menghapus seluruh SMS yang diblok hanya dengan menggoyang-goyangkan handphone-nya. 3 Menambahkan dan menghapus blacklist
maupun whitelist number.
4 Pengaturan notifikasi: pengguna dapat mengatur on maupun off untuk notifikasi yang muncul ketika terdeteksi adanya SMS
spam.
5 Pengaturan metode blokir SMS: pengguna dapat mengatur otomatis atau tidaknya sistem dalam memblokir SMS yang terdeteksi sebagai spam.
Metode blokir SMS ada dua macam, yaitu otomastis dan manual. Pengguna dapat memilihnya di menu Pilihan, seperti yang terlihat pada Gambar 8. Jika pengguna memilih otomatis, maka SMS yang terdeteksi sebagai
spam langsung dimasukkan ke dalam database. Jika pengguna memilih tidak otomatis atau manual, maka ketika ada SMS yang terdeteksi sebagai spam, sistem akan menampilkan SMS tersebut dalam bentuk popup seperti yang terlihat pada Gambar 9.
Dengan popup tersebut pengguna dapat memutuskan sendiri apakah SMS yang terdeteksi sepenuhnya spam atau bukan. Pada SMS popup tersebut terdapat tiga tombol, yaitu tombol Selalu Blokir, tombol Izinkan Sekali, dan tombol Selalu Izinkan. Fungsi dari masing-masing tombol dapat dilihat pada Tabel 4 berikut:
Tabel 4 Fungsionalitas tombol pada SMS popup
Tombol Fungsi Selalu
Blokir
Memblokir SMS dan
memasukkannya ke dalam
spam dan otomatis nomor whitelist dan blacklist.
Selalu
Gambar 8 Tampilan menu Pilihan.
Gambar 10 Tampilan menu spam.
Gambar 11 Tampilan review blocked SMS. Tampilan list dari nomor whitelist dan
blacklist dapat dikatakan sama seperti yang terlihat pada Gambar 12 dan 13. Tidak hanya tampilan, namun juga fitur yang ada juga sama. Hanya nomor dan icon sampah yang ditampilkan. Icon sampah ini dapat diklik dan berfungsi untuk menghapus nomor yang dipilih. Selain itu, terdapat menu option untuk menambahkan nomor baru secara manual. Untuk lebih jelas mengenai aplikasi SMS spam detector ini, terdapat sequence diagram dari sistem yang dapat dilihat pada Lampiran 4.
Gambar 12 Tampilan menu Izinkan.
Gambar 13 Tampilan menu Blokir.
Pengujian Sistem
Pada pengujian sistem, data yang digunakan sebanyak 60 SMS yang terdiri atas 30 SMS
spam dan 30 SMS nonspam. Rincian SMS
spam yang digunakan dalam pengujian ini dapat dilihat pada Lampiran 5, sedangkan untuk SMS
Tabel 5 Hasil klasifikasi
Berdasarkan hasil diatas dapat disimpulkan bahwa kinerja klasifikasi pada sistem ini sangat bagus karena akurasi, precison, dan recall-nya mencapai 100%. Selain itu kinerja di
smartphone Android juga menunjukkan kinerja yang cukup bagus dengan waktu relatif singkat dapat mengklasifikasikan SMS yang masuk.
KESIMPULAN DAN SARAN
Kesimpulan
Hasil penelitian ini menunjukkan bahwa: 1 Telah diimplementasikan algoritme Naïve
Bayes pada sistem SMS spam detector pada
platform mobile Android untuk versi 2.1 sampai versi 4.0.3.
2 Telah dihasilkan sistem deteksi SMS spam
pada platformmobile Android untuk Bahasa Indonesia baik yang baku maupun tidak baku.
3 Kinerja klasifikasi pada sistem sangat baik dengan akurasi, precision, dan recall
mencapai 100% dan kinerja di smartphone
Android yang cukup bagus.
Saran
Saran untuk penelitian selanjutnya :
1 Dapat menambahkan fitur-fitur baru yang dapat mempermudah pengguna dalam menggunakan aplikasi ini, misalnya menambahkan blacklist dari SMS atau kontak.
2 Sistem SMS spam detector ini dapat di terapkan pada platform mobile yang lain seperti blackberry, windows phone, dan IOS.
3 Menggunakan data SMS yang lebih banyak dan lebih beragam supaya kinerja sistem dapat lebih baik lagi.
DAFTAR PUSTAKA
Androulidakis II. 2012. Mobile Phone Security and Forensics. New York: Springer.
Burnette E. 2008. Hello, Android, Introducing
Google’s Mobile Development Platfo m.
Dallas: Pragmatic Bookshelf. Hal 30-34.
Bringas GC, Hidalgo JMG, Sánz EP. 2006. Content based SMS spam filtering. Di dalam: Proceedings Of The 2006 ACM Symposium On Document Engineering; Amsterdam, 10-13 Oct 2006. New York: ACM. hlm 107-114.
Cormack GV, Hidalgo JMG, Sánz EP. 2007. Feature engineering for mobile (SMS) spam
filtering. Di dalam: 30th ACM SIGIR Conference on Research and Development on Information Retrieval; Amsterdam, 23-27 Jul 2007. New York: ACM. hlm 871-872. Cormack GV, Hidalgo JMG, Sánz EP. 2007.
Spam filtering for short messages. Di dalam: Proceedings of the sixteenth ACM conference on Conference on information and knowledge management; Lisbon, 6-10 Nov2007. New York: ACM. hlm 313-320 Han J, Kamber M, Pei J. 2012. Data Mining:
Concept and Techniques. Ed Ke-3. Waltham: Morgan Kaufmann Publishers. [IDC]. International Data Corporation. 2012.
Android Overtakes BlackBerry as the Top Smartphone Operating System in Indonesia, says IDC. http://www.idc.com/getdoc.jsp? containerId=prID23688812. [13 September 2012]
Jalloul G. 2004. UML by Example. Cambridge: Cambridge University Press.
Berry MW, Kogan J. 2010. Text Mining: Applications and Theory. Chichester: John Wiley & Sons.
Mahmoud TM, Mahfouz AM. 2012. SMS spam filtering technique based on artificial immune system. International Journal of Computer Science Issues IJCSI 9:589-597. Palupiningsih P. 2011. Technical Paper On Data
Mining. Program S2 Ilmu Komputer Institut Pertanian Bogor.
Lampiran 1 Contoh macam-macam jenis data SMS untuk data latih
No. Data SMS Kategori
1 ini nomor baru papa, tolong kirimin pulsa 50.000 ke nomor baru papa 085687329010. Papa lagi di kantor polisi, ada masalah. Jangan telepon Papa.
SMS permintaan pulsa
2 Kesempatan jadi AGEN PULSA MKIOS ALL Operator harga V5=4500, V10=8500, V20=18rb, V25=23rb, V50=45rb, V100=90rb Cara Ketik Daftar kirim ke 087888366677
SMS penawaran menjadi agen pulsa
3 Se !! A Me ’ i R .75 u . D i TELKOMSELpoin "Periode maret" PIN anda(33c7) Hub kntr pusat: 082113720777 (Ir.Wardoyo).
SMS undian berhadiah
4 Sy Dr.Rimbawan(Dirmawa IPB)Yth,Jajang Roni Aunul Kholik(NIM:E14090090)Di minta Hbngi Skrng Prof.Dr.Ir.Yonny
Koesmaryono,MS.0819882923.Di Tunjuk Hadir Seminar Pengembangan Karakter Mahasiswa Dari Dikti Tgl 14/15 April di Htl Nusa Dua Bali,Trims.
SMS keikutsertaan seminar dari lembaga tertentu
5 Tolong uangnya dikirim aja kesini BANK DANAMON a/n Farida hanum No rek. 0035-3918-4014 SMS aja klo udah dikirim, Trims
SMS permintaan transfer sejumlah uang ke rekening tertentu
6 M …! y bu RATNA meganai RUMAH saya Sudah liat, soalnya saya lagi di bandara silahkan hubungi suami saya H. ARIF ISKANDAR,SE hp:081218844557 trims.
SMS yang menunjukkan ketertarikan pada proses jual beli rumah
7 Ass.sy SUGIYONO yg tempo hari mngenai mobil TOYOTANYA,sy brminat,cocok,tlong hub sodara sy dlu,untuk negosiasi harganya.
A/N;ABDULLAH HP;081389909777
SMS yang menunjukkan ketertarikan pada proses jual beli mobil
8 Maaf saya Bu Nur, tanah yang di tanjung api-api saya sudah lihat dan sudah cocok, untuk masalah harga tolong hubungi suami saya aja, pak H.SULAIMAN di no hp. 08xxxxxx, karena kebetulan saya ada acara.Tks
Lampiran 2 Reprentasi data SMS dalam bentuk XML No. Representasi data XML
1 <SMS>
<CLASS>spam </CLASS><ID>1</ID>
<CONTENT>ini nomor baru papa, tolong kirimin pulsa 50.000 ke nomor baru papa 085687329010. Papa lagi di kantor polisi, ada masalah. Jangan telepon Papa.</CONTENT> </SMS>
2 <SMS>
<CLASS>spam </CLASS><ID>2</ID>
<CONTENT>Kesempatan jadi AGEN PULSA MKIOS ALL Operator harga V5=4500, V10=8500, V20=18rb, V25=23rb, V50=45rb, V100=90rb Cara Ketik Daftar kirim ke 087888366677</CONTENT>
</SMS> 3 <SMS>
<CLASS>spam </CLASS><ID>3</ID>
<CONTENT> Se !! A Me ’ i R .75 u . D i TELKOMSEL i "Pe i e maret" PIN anda(33c7) Hub kntr pusat: 082113720777 (Ir.Wardoyo).</CONTENT>
</SMS> 4 <SMS>
<CLASS>spam </CLASS><ID>4</ID>
<CONTENT>Sy Dr.Rimbawan(Dirmawa IPB)Yth,Jajang Roni Aunul Kholik
(NIM:E14090090) Di minta Hbngi Skrng Prof.Dr.Ir.Yonny Koesmaryono, MS. 0819882923. Di Tunjuk Hadir Seminar Pengembangan Karakter Mahasiswa Dari Dikti Tgl 14/15 April di Htl Nusa Dua Bali,Trims.</CONTENT>
</SMS> 5 <SMS>
<CLASS>spam </CLASS><ID>5</ID>
<CONTENT>Tolong uangnya dikirim aja kesini BANK DANAMON a/n Farida hanum No rek. 0035-3918-4014 SMS aja klo udah dikirim, Trims</CONTENT>
</SMS> 6 <SMS>
<CLASS>spam </CLASS><ID>6</ID>
<CONTENT>M …! y bu RATNA e i RUMAH y Su i soalnya saya lagi di bandara silahkan hubungi suami saya H. ARIF ISKANDAR,SE hp:081218844557
trims.</CONTENT> </SMS>
7 <SMS>
<CLASS>spam </CLASS><ID>7</ID>
<CONTENT>Ass.sy SUGIYONO yg tempo hari mngenai mobil TOYOTANYA,sy brminat, cocok, tlong hub sodara sy dlu,untuk negosiasi harganya. A/N;ABDULLAH
HP;081389909777</CONTENT> </SMS>
8 <SMS>
<CLASS>spam </CLASS><ID>7</ID>
<CONTENT>Maaf saya Bu Nur, tanah yang di tanjung api-api saya sudah lihat dan sudah cocok, untuk masalah harga tolong hubungi suami saya aja, pak H.SULAIMAN di no hp. 08xxxxxx, karena kebetulan saya ada acara.Tks</CONTENT>
Lampiran 3 Contoh hasil tahap data latih
No. Kata unik Peluang Kelas
1 Beliin 0.000451263537906137 Nonspam
2 Belikan 0.000225631768953069 Nonspam
3 Hubung 0.000225631768953069 Nonspam
4 Isi 0.000676895306859206 Nonspam
5 Isiin 0.000225631768953069 Nonspam
6 Kantor 0.000225631768953069 Nonspam
7 Kirim 0.000676895306859206 Nonspam
8 Kirimin 0.000225631768953069 Nonspam
9 Mama 0.000451263537906137 Nonspam
10 Mobil 0.000676895306859206 Nonspam
11 Nomor 0.000225631768953069 Nonspam
12 Papa 0.000225631768953069 Nonspam
13 Polisi 0.000225631768953069 Nonspam
14 Pulsa 0.00225631768953069 Nonspam
15 Rumah 0.00112815884476534 Nonspam
16 Sempat 0.000225631768953069 Nonspam
17 Tanah 0.000225631768953069 Nonspam
18 Tolong 0.000902527075812274 Nonspam
19 Beliin 0.000938614604843251 Spam
20 Belikan 0.000938614604843251 Spam
21 Hubung 0.00337901257743571 Spam
22 Isi 0.00131406044678055 Spam
23 Isiin 0.000563168762905951 Spam
24 Kantor 0.0011263375258119 Spam
25 Kirim 0.00563168762905951 Spam
26 Kirimin 0.000563168762905951 Spam
27 Mama 0.00544396470809086 Spam
28 Mobil 0.0015017833677492 Spam
29 Nomor 0.0030035667354984 Spam
30 Papa 0.0026281208935611 Spam
31 Polisi 0.0011263375258119 Spam
32 Pulsa 0.00825980852262061 Spam
33 Rumah 0.00356673549840436 Spam
34 Sempat 0.000938614604843251 Spam
35 Tanah 0.000938614604843251 Spam
Lampiran 4 Sequence diagram sistem
User
Message System Database
Incoming Message
Inbox
IsSpam == true
IsSpam == false
Notification
Display spam message Get spam message
Notification
Delete spam message
Spam message move to inbox
Input whitelist Add whitelist
Get whitelist Display whitelist
Input blacklist Add blacklist
Get blacklist Display blacklist
Set notification == yes
Set notification == no
Delete Whitelist
Lampiran 5 Data uji SMS spam
No. SMS
1 plg yth no. Anda terpilih menang cek Rp.100jt dr PT.TELKOMSEL HUT TELKOMSEL Ke-17 thn 2012 hub call center: 085313311113
2 Dapatkan Segera TIKET Murah & Promo DiTRAVEL Kmi,Untuk Penerbangan Domestik & Internasional ONLINE BOOKING 24 Jam Anda Berminat Hub:085318303276
3 Tolong uangnya dikirim aja kesini BANK DANAMON a/n Farida hanum No rek; 0035-3918-4014. SMS aja klo udah dikirim,Trims
4 Sy RUDI di jambi, bgi tman2 yg sering kalah Togel saatnya kalahkan bandar hub mbah ROS 082325557768 di jamin tembus, sy sdh buktikan 4D 50jt.
5 Penawaran terbatas software SMS gateway utk iklan SMS, pilkada, sekolah, instansi, kampus dll. Harga promo rp. 100.000 hub:jasa advertising corp 085727088813 24jam. 6 Di transfer saja Uang'nya ke rekening BNI ini, a/n. ISMAWATI. Rek: 0248147033. SMS
saja klo sdh kirim.
7 Uangnya dikirim saja ke Rek. BANK BNI A/n. : Sdr ABDUL RAHMAN No. Rek. : 024-8721-191 SMS saja kalau sudah dikirim. terima kasih
8 Transfer saja uangnya ke rek ini.mandiri.NO Rek: 152-00-1236312-9.a/n:DARMAN. klau sdah di Transfer SMS saja ke nmor ini Trima kasih
9 Seminar ke Denpasar Bali mewakili kemahasiswaan & kewirausahaan dapat biaya transport Rp 10 juta. Nomor Peserta 100/semnas/9997175/dikti/2011. Direktur Kemahasiswaan DIKTI Prof. Dr. Joko Purwanto, M.Si. Hubungi 081281108799 Wahyudin Zarkasi. No. referensi PTX:001/3591/0100/1572/503
10 Yth Isti Sofiyah. Diminta Segera Hubungi Bpk Drs.H .Lalu S i’ i M.P . K i i NT . 08531166 6557 Perihal Seminar Gratis Dari DIKTI. (Bu Sri TU.Diknas)
11 Butuh Dana Tunai Cepat 25-250 Juta Dgn Bunga Rendah 1,35% Flat/Bln Proses Dijamin 3 Hari Syarat Mudah Info Ibu YANI : 081218986001
12 Dijual ticket SUPER JUNIOR TGL 28/29 APRIL dan LADY GAGA TGL 03 JUNI harga Gold=2,25jt tribun3=1,25jt info hub;0853-9937-1888 lady-ticket.webs.com
13 meganai Ruma bpk/ibu yg mau di jual sd di surpai dan sy berminat sy tlpn tdk bisa tembus masalah harga hub suami sy 085399700354 Dr.H.IRAWAN
14 Manfaatkan segera creditCard anda utk apply pinjaman 20-250jt ada cashback berminat hub: Bintang 021-27450166.tks
15 Nasabah Yth Dapatkan Solusi untuk Masalah Keuangan Anda 10 s/d 300 jt Rate ringan,proses 3hr Syrat ktp & card Info:Abu tlp 83622112 hp 081298222100
16 Berbagai Promo BlackBerry Onyx2 9780 Rp1,5jt & Torch 9800 Rp2jt Info SMS/hub: 085322215000 a/kunjungi:www.hary-shop-online.blogspot.com
17 Uangnya di Trnsfer di BNI ini aja a/n RASTINA NO.REK.0253 7915 37.Klo sdh d Trnsfer SMS i i i 085293355598 T .” D i : 6285315904528
18 Tolong uangnya dikirim aja kesini BANK DANAMON a/n Farida hanum No rek; 0035-3918-4014 SMS aja klo udah dikirim,Trims
19 Tolong kirimin mama pulsa. Skrng penting! Jangan telpon balik. Mama lg d kantor polisi 20 Ini bpk lg pinjam Hp org,tlong beli'in bpk pls 20rb k nomor ini 085215126428, bpk lg ada
mslh d kntr polisi. Jgn d tlpn/SMS dl. Nnti bpk yg tlpn,skrg pnting
21 PRIMA CELL Cari agen jual pulsa ALL oprator HARGA; P5 :4500 P10:8500 P20:17000 P50:45000 U/ Info ketik:PRIMA kirim ke:085322213339 atau HUB CS:082347288777 22 maaf sy ibu johar, melanjuti hasil survey terhadap rumah ibu yg mau dijual kami rasa itu
cocok dan minat u/info harga mhn hub suami sy Bpk H. Laode Hp 081210511553
Lampiran 6 Lanjutan No. SMS
24 Penawaran terbatas software SMS gateway utk iklan SMS, pilkada, sekolah, instansi, kampus dll. Harga promo rp. 100.000 hub:jasa advertising corp 085727088813 24jam
25 Saya Martinus, mnt tlg krmkan pulsa ke No.08138664129 brp aja buat hub keluarga tmn sy, yng kecelakaan di tengah hutan, kondisix sangat parah, sblmx trima kasih
26 Tolong belikan dulu Mama Pulsa Rp20.ribu di nomor baru Mama. Ini nomornya,
081284104522 secepatnya ya.. Penting. Nanti Mama ganti uangnya. Sekarang Mama Tunggu ya
27 Maaf Melalui SMS, kalau mau di trus,in atau byar sewa kontrakan rumahnya, ke adik saya Herdian hp 085222288580. Soal,nya da di kuasakan/di jual ke adik Trimks.
28 SID@MUNCUL (SIDOMUNCUL)Selamat! SimCard Anda mendptkan hadiah Rp.15jt, dr KukuBima ENER-G!. U/Info hub ktr PT.SIDOMUNCUL: 021 - 4919 1267 29 BERANI CELLULAR. DISKON 50% berbagai promo type blackberry DAKOTA 2,6jt,
TORCH 2jt, ONYX2 1,8jt. INFO SMS/CALL 085339821*** atau kunjungi www.***.blogspot.com
Lampiran 7 Data uji SMS nonspam
No. SMS
1 Klo d bkin installer dlu gmn ka? Mau ngumpulin project psbo nh. tp bingung ap yg d kumpulin haha
2 Klo mau ambil .xap nya ada di folder bin atau debug...kalo mau langsung ke hp harus di unlock dulu hp nya
3 Te, nilai penkomnya udh lo kumpulin blm?
4 Lgi santai sejenak pak...abis pulang kerja tadi...Mungkin pak rofiq di nilai baik oleh kepsek...telah mengangkat nama olimpiade komputer smandung. Menurut saya si wajar pak...mungkin lebih sabar ngejelasin ke pak kepsek alasan bapak tidak lg ngajar di smandung...mungkin bapak bisa merekomendasi teman atau siapa saja untuk menjadi pengganti bapak di smandung, mungkin bapak lebih taw kriterianya... :-D
5 Harusnya sih gitu Ted, haha ktanya lu udh disuruh sminar?
6 Emailny blm dbls sm pak hari te. Lo wktu tu prnh dbls pagi2 ga emailny? 7 O maaf Ted, wktu itu hanif SMS pake no. ini, makasih
8 Tmen2 45,dmhon dg sngat khadirany dlm acra IMAPEKA CUP yg akn dmulai pd rabu 6juni12 pkul 18.00@gor lma,qt membtuhkan bnyak sdm unt maen minton,g perlu hwtir g pny raket,akn dpnjamkn,jgn tkut g sa maen,qt tjuany unt snang2,jgn minder dmi angktan qt d IMAPEKA,wajib hdir ya,dtnggu
9 Ada.kok nis di sampingnya itu...liat contoh yg udah jdi aja di internet nis
10 Lupakan progres bar itu kak. Ganti bikin form input. Trus buat liat gimana tampilannya dimana kak?
11 Kalo mau pake progres bar harus ngerti thread nis 12 Kakak, kalo bikin form inputan harus pake xml?
13 Bukan rada kak. Ini ribet bangeet. Jadi intinya menyerah aja ya kak. Okee, bilang Ozi. 14 Besok kak. Gimana cobaaaaa? Aku ga ngerti kakaaak. Eclipse-nya aja ga bisa" diinstal.
Nyerah aja kali ya kak, mumpung masih sore.
15 Dua atau tiga hari ke depan insyaAllah ditransfer ya kak. Iya kakak nyantai aja. Disuruh bikin progres bar buat mutabaah sama Ozi. Projek psbo kak. Ok kakak, makasih ya.
16 0153673812 atas nama karimul makhtidi. Oiya nis fitur tambahannya ntar minggu depan baru ku tambahin ya...Seringnya googling si, jd gak apal web nya...:-D. Mau bikin aplikasi apa nis! 17 Klo emg bpkny ga bs sbtu gw si pgn ikut bmbgn senin, tp gtw tmptny dmn.he
18 Kakak, minta nomer rekening. Kak, sekalian tanya. Tau web buat belajar koding Android sama sqlite ga kak? Makasih kakak...
19 Iya gw si jg udh email bpkny nnya sbtu bsk ada apa ga. Bysany klo lo email si bpk dblsny kpn te?
20 Nggak, rencananya gw mau bimbingan senin. Pak hari nawarin gw bwt bimbingan di jkt, kata alif. Jadi gw mau bimbingan senin di jkt
21 Cie bosen 4ever alone minta tmenin ka hendro. iye ted sndirian ni gw nunggu bus, ga dateng".. 4ever alone
22 Katanya 1 minggu ted,,Dlm rangka kerjasama projek penelitiannya ibu,yg insyaAllah bkl jd penelitian mga slnjtnya,, Mga d suruh lanjut s2 ted,,Doain aja ya,,hehe,,:-D
23 Ri, gw gak ke bogor sabtu minggu ini..lg mau ngejar makalah.. :-D
24 Ri, gw ke kosan lw sekarang aja yak...air di kosan gw mati..sekalian sholat asar...lw di al izah yg sebelah mana ri?
25 Asaan dulu pernah denger katanya kakak seminar bln april.. Tp ga denger kabar nya lagi. amiin.. Cepet seminar, cepet sidang, biar kerja nya juga tenang.
Lampiran 8 Lanjutan No. SMS
27 Klo kta tmen gw mending langsung ke tkp...biar liat langsung..kalo suka ya langsung aja di dp ato di omongin ke pemiliknya..soalnya kalo gak gitu ntar keburu di ambil orang Kalo yg temen gw itu udah penuh jga
28 Kakak, pulsa anis habis. Nanti diemailin kak passwordnya. Lg kuliah kripto. Eh, itu maksudnya password user mybaby tuh buat login mybaby ya? Kalo itu mah 12345 bukan? 29 Tgl 27/6 reg asrma angktn 49,yg msih di bogor dmhn bs ikt mnymbt 2.Pelnsn jket max. 30/6
ke Ersa 085866199692 3.Ssuai ksepktn AD/ART,stiap anggta wjib mmbyr iurn 25rb/th, ke Elok +6281903666185 (Rek.BNI 0197707183) max. 30/6