i
PENAMAAN LABEL TEKS PENDEK (TWEET) DI TWITTER MENGGUNAKAN JACCARD COEFFICIENT
TUGAS AKHIR
Sebagai Persyaratan Guna Meraih Gelar Sarjana Strata 1 Teknik Informatika Universitas Muhammadiyah Malang
Oleh :
ROUDHOTUL JANNAH
09560502
JURUSAN TEKNIK INFORMATIKA FAKULTAS TEKNIK
UNIVERSITAS MUHAMMADIYAH MALANG
2013
ii
LEMBAR PERSETUJUAN
PENAMAAN LABEL TEKS PENDEK (TWEET) DI TWITTER MENGGUNAKAN JACCARD’S COEFFICIENT
TUGAS AKHIR
Sebagai Persyaratan Guna Meraih Gelar Sarjana Strata 1 Teknik Informatika Universitas Muhammadiyah Malang
Menyetujui,
Pembimbing I
Yuda Munarko,S.Kom, M.Sc NIP. 108.0611.0443
Pembimbing II
Yufis Azhar, S.Kom NIDN.0728088701
iii
LEMBAR PENGESAHAN
PENAMAAN LABEL TEKS PENDEK (TWEET) DI TWITTER MENGGUNAKAN JACCARD’S COEFFICIENT
TUGAS AKHIR
Sebagai Persyaratan Guna Meraih Gelar Sarjana Strata 1 Teknik Informatika Universitas Muhammadiyah Malang
Disusun Oleh : Roudhotul Jannah
NIM.09560502
Tugas Akhir ini telah diuji dan dinyatakan lulus melalui sidang majelis penguji pada tanggal 3 Agustus 2013
Menyetujui, Penguji I
Zamah Sari, ST, MT NIDN. 0708087701
Penguji II
Dhebys Suryani, S.Kom, MT NIDN.07061188303
Mengetahui
Ketua Jurusan Teknik Informatika
Eko Budi Cahyono, S.Kom, MT NIP. 108.9504.0330
iv
LEMBAR PERNYATAAN
Yang bertanda tangan di bawah ini :
NAMA : ROUDHOTUL JANNAH
NIM : 09560502
FAKULTAS / JURUSAN : TEKNIK / INFORMATIKA
Dengan ini saya menyatakan bahwa Tugas Akhir dengan judul “PENAMAAN LABEL TEKS PENDEK (TWEET) DI TWITTER MENGGUNAKAN JACCARD’S COEFFICIENT” beserta seluruh isinya adalah karya saya sendiri dan bukan merupakan karyatulis orang lain, baik sebagian maupun keseluruhan, kecuali dalam bentuk kutipan yang telah disebutkan sumbernya.
Demikian surat pernyataan ini saya buat dengan sebenar-benarnya. Apabila kemudian ditemukan adanya pelanggaran terhadap etika keilmuan dalam karya saya ini, atau diklaim dari pihak lain terhadap keaslian karya saya ini maka saya siap menanggung segala bentuk resiko / sanksi yang berlaku.
Malang, 23 Agustus 2013 Yang Membuat Pernyataan
(Roudhotul Jannah)
Mengetahui,
Dosen Pembimbing I
(Yuda Munarko,S.Kom, M.Sc) NIP. 108.0611.0443
Dosen Pembimbing II
(Yufis Azhar, S.Kom ) NIDN.0728088701
v
LEMBAR PERSEMBAHAN
Dengan mengucap puji syukur kehadirat Allah SWT atas segala rahmat serta hidayahnya sehingga laporan tugas akhir dengan judul : “Penamaan Label Teks Pendek (Tweet) di Twitter Menggunakan Jaccard Coefficient” dapat penulis selesaikan.
Tugas Akhir ini merupakan salah satu prasyarat untuk menyelesaikan studi tingkat strata satu di Fakultas Teknik Jurusan Informatika Universitas Muhammadiyah Malang. Selama penyelesaian tugas akhir ini, penulis telah memperoleh banyak bantuan, bimbingan, motivasi dan saran yang berguna dari berbagai pihak. Oleh karena itu, pada kesempatan ini penulis ingin mengucapkan rasa terima kasih kepada :
1. Bapak Yuda Munarko,S.Kom, M.Sc, MT. selaku Dosen Pembimbing I, yang telah meluangkan waktu untuk memberikan bimbingan maupun pengarahan dalam penyelesaian tugas akhir ini.
2. Bapak Yufis Azhar, S.Kom selaku Dosen Pembimbing II, yang telah meluangkan waktu dalam memberikan bimbingan maupun pengarahan dalam pencapaian hasil yang maksimal pada penelitian tugas akhir ini.
3. Bapak Eko Budi Cahyono, S.Kom, MT dan Seluruh Dosen serta staff Jurusan Teknik Informatika.
4. Kedua orang tua dan keluarga yang selalu memberikan dukungan, motivasi dan do’a dan semangat materiil maupun spirituil yang tak ternilai harganya.
5. Para sahabat- sahabat dan teman-teman saya utamanya keluarga Upin-Ipin (Dini/Susanti,Nora /Upin, dan Iva/Ipin)yang selalu memberikan supprot dan dukungannya serta menyediakan waktu dan tempat untuk membantu proses pengerjaan pengambilan data utamanya.
6. Sahabat- sahabat dan teman- temanku jurusan teknik informatika angkatan 2009 khusunya kelas J,
7. Mbak ratna, Pak Bambang, Mas Windra dan Rozik dan bapak ibu dosen pasca psikologi selaku rekan di kantor Direktur Pasca Sarjana Psikologi UMM yangsudah memberikan dukungan dan do’anya.
8. Buat teman-teman dikos 14 B yang telahmemberi supportdan mendo’akan selalu.
vi
KATA PENGANTAR
Assalamu’alaikum Wr. Wb
Dengan memanjatkan puji syukur kehadirat Allah SWT, atas limpahan rahmat dan hidayah-Nya serta salawat dan salam yang tercurahkan kepada junjungan nabi besar Muhammad SAW sehingga penulis dapat menyelesaikan Tugas Akhir yang berjudul :
“PENAMAAN LABEL TEKS PENDEK (TWEET) DI TWITTER MENGGUNAKAN JACCARD’S COEFFICIENT”.
Penyusunan Laporan Tugas Akhir ini merupakan salah satu persyaratan untuk mencapai kelulusan dan memperoleh gelar Sarjana Teknik dalam Program Studi Teknik Informatika Program Strata I Jurusan Teknik Informatika, Fakultas Teknik, Universitas Muhammadiyah Malang.
Di dalam tulisan ini disajikan pokok-pokok bahasan mengenai penjelasan penaman label pada teks pendek (Tweet) di twitter menggunakan perhitungan jaccard’s coefficient untuk menentukan kedekatan kata dan sebagaianya, sehingga bisa dilakukan penamaan label.
Penulis menyadari sepenuhnya bahwa Laporan Tugas Akhir ini masih jauh dari kesempurnaan, oleh karena itu penulis sangat mengharapkan kritik dan saran yang membangun dari semua pihak sehingga di dalam pembuatan laporan yang akan datang akan jauh lebih sempurna.
Akhir katapenulis berharap, semoga Laporan Tugas Akhir ini dapat bermanfaat bagi penulis khususnya dan para pembaca pada umumnya.
Wassalamu’alaikum Wr. Wb.
Malang, 23 Agustus 2013
Roudhotul Jannah
vii
DAFTAR ISI
HALAMAN JUDUL ... i
LEMBAR PERSETUJUAN ... ii
LEMBAR PENGESAHAN ... iii
HALAMAN PERNYATAAN KEASLIAN ... iv
ABSTRAK ... v
ABSTRACT ... vi
LEMBAR PERSEMBAHAN ... vii
KATA PENGANTAR ... viii
DAFTAR ISI ... ix
BAB I PENDAHULUAN 1.1 Latar Belakang ... 1
1.2 Rumusan Masalah ... 2
1.3 Tujuan ... 2
1.4 Batasan Masalah ... 2
1.5 Metodologi Penyelesaian Masalah ... 3
1.5.1 Pengumpulan Data ... 3
1.5.2 Membangun Sistem... 3
1.5.3 Alur Perancangan Sistem ... 3
1.5.4 Analia Karakteristik ... 4
1.5.5 Pengujian Sistem... 4
1.5.6 Penyusunan Laporan ... 5
1.6 Sistematika Penulisan ... 5
BAB II LANDASAN TEORI 2.1 Defini Twitter ... 6
2.2 Label Teks... 6
2.2.1Definisi Label Teks ... 6
2.2.2 Fungsi Penamaan Label Teks ... 7
2.3 Ekstraksi Kata Pokok ... 8
2.3.1 Definisi ... 8
2.4 Definisi Jaccard Coefficient... 8
2.5 Java ... 9
2.6 MySQL ... 11
2.6.1 Pengertian MySQL ... 11
2.6.2 Fitur-fitur MySQL ... 11
BAB III ANALISIS DAN PERANCANGAN 3.1 Analisa Masalah ... 13
3.1.1 Desain Perangkat Lunak ... 13
3.2 Pengumpulan Data ... 14
3.2.1 Aplikasi Pengambilan Tweet ... 15
viii
3.3 Penyaringan Data Training ... 16
3.3.1 Penyaringan Data Training dan Testing ... 16
3.3.2 Pemisahan Atribut-atribut di Twitter ... 17
3.4 Ekstraksi Data Fitur-Fitur Tweet ... 17
3.4.1 Penghapusan Nama Author ... 17
3.4.2 Ekstraksi Kata Pokok Atau Istilah ... 18
3.4.3Tweet dalam Bahasa Indonesia ... 18
3.4.4 Pengelompokkan Istilah Dalam Kategori ... 18
3.5 Mekanisme Data Testing Menggunakan Jaccard Coefficient Untuk Penamaan Label ... 19
3.5.1 Penerapan Jaccard coefficient pada Similaritas Kata Pokok ... 19
3.5.2Mekanisme Penerapan Jaccard Coefficient Pada Penamaan Label Teks Pendek atau tweet ... 20
BAB IV IMPLEMENTASI DAN PENGUJIAN 4.1 Implementasi Interface Program Pengambilan Data ... 21
4.1.1 Form Login... 21
` 4.1.2 Form Tampilan Tweet ... 22
4.2 Pengujian Sistem dan Analisa ... 22
4.2.1 Pengujian Fungsi ... 23
4.2.2 Pengujian Sistem ... 24
4.2.2.1 Proses Insert Istilah dan Kategori ... 24
4.2.2.2 Proses Menambah Istilah Dan Kategori ... 28
4.2.2.3 Pengujian Penerapan Jaccard Coefficient ... 30
4.2.2.4 Perbandingan Hasil Uji Data Testing dan Data Training ... 33
4.3 Implementasi Database ... 34
BAB V KESIMPULAN DAN SARAN 5.1 Kesimpulan ... 36
5.2 Saran ... 37
DAFTAR PUSTAKA LAMPIRAN
ix
DAFTAR PUSTAKA
1. Hermawan, B. 2004.”Menguasai JAVA 2 & Object Oriented Programming”.Yogyakarta: ANDI
2. Heymann,Paul.2008.”Label Teks and Tagging teks”.Fukuoka, Kyushu University.
3. Kadir, A. 2009. “Membuat Aplikasi Web dengan PHP + Database Mysql”.Yogyakarta: ANDI
4. Mashable .http://mashable.com/2008/07/18/twitter-not-a- microblogging-tool/ (di akses November 2012).
5. Ohiolink.edu.http://etd.ohiolink.edu/sendpdf.cgi/. (di akses November 2012 ).
6. Puslit jurnal. http://puslit2.petra.ac.id/ejournal/. (di akases November 2012).
7. Ramadhan, fakhriy. 2011.”Implementasi MYSQL Cluster Menggunakan Pemanfaatan Avalaibility Pada Penginputan Data Mahsiswa Dengan Aplikasi Berbasis Java”.Bandung:Skripsi
8. Sriram Barath. 2010. Short Text Classification in Twitter to Improve Information Filtering (di akses November 2012).
9. Wibisono,Yudi.2011.http://yuliadi.com/file/paper/yudi_wibisono_siste m_analisis_opini_microblogging_ver4.pdf (di akses Februari 2013).