Pemetaan Konten Pornografi Berbahasa Indonesia Pada Media Sosial
Reza Chandra
Manajemen Informatika, Universitas Gunadarma Jl. Margonda Raya No. 100, Depok 16424, Jawa Barat
reza_chan@staff.gunadarma.ac.id
Abstrak
Perkembangan teknologi dan informasi yang semakin pesat termasuk salah satunya adalah internet. Pengguna internet mulai memberikan opini mereka terhadap berbagai topik di media sosial salah satunya adalah media sosial twitter. Untuk menganalisis sejumlah data yang besar secara cepat dan efektif agar menghasilkan informasi diperlukan metode untuk mengukur pendapat publik secara otomatis. Penggunaan metode preproccesing adalah untuk membersihkan data, menghilangkan tweet yang muncul berulang, dan membakukan kalimat yang tidak baku sehingga mendapatkan data bersih. Pengamatan secara langsung ke data tweet ditemukan bahwa twitter menjadi sarana yang baik untuk saling berkomunikasi dan bertransaksi diantaranya adalah mencari video call seks, ajakan untuk melakukan hubungan seks, dan saling berbagi foto seks.
Kata Kunci: Sentimen Analisis, Twitter, Preprocessing, Sentimen Analisis Pornografi.
Abstract
The development of technology and information that is increasingly fast, including one of which is the internet. Internet users have begun to give their opinions on various topics on social media, one of which is social media twitter. To analyze the large amount of data and quickly in order to effectively produce the information needed to measure public opinion automatically. The use of preprocessing methods is to save data, eliminate tweets that appear repeatedly, and standardize sentences that are not standard so that they get clean data. In connection with the tweet data, it was found that Twitter is a good tool to communicate and transact with one another looking for sex video calls, invitations to have sex, and share sex photos.
Key Words: Sentiment Analysis, Twitter, Preprocessing, Sentiment Analysis Pornography.
PENDAHULUAN
Kemajuan era globalisasi saat ini telah memberi dampak positif dan negatif diberbagai bidang kehidupan. Salah satu bidang tersebut adalah kemajuan teknologi informasi yang membantu dan mempermudah manusia. Namun kemajuan teknologi juga memberi banyak dampak negatif yang merugikan. Media sosial merupakan contoh kemajuan teknologi informasi pada saat ini dan menarik perhatian banyak orang. Contoh media sosial yang umumnya digunakan yaitu Facebook, Twitter,Instagram, dan Path. Media sosial menjadi salah satu media yang menghubungkan orang-orang di seluruh dunia. Namun kehadiran media sosial juga
menjadi salah satu sarana untuk terjadinya hal-hal negatif yang merugikan seperti penyebaran status, gambar, dan video pornografi.
Twitter merupakan salah satu media sosial dengan jutaan pengguna. Jumlah pengguna Twitter pada tahun 2016 yaitu sekitar 332 juta pengguna bulanan dengan 500 ribuan tweet setiap hari dan 200 milliaran tweet setiap tahun (Maulana, A., 2017). Twitter digunakan dalam penelitian ini karena proteksi terhadap tweet, gambar, dan video yang bersifat pornografi masih lemah sehingga bila ditelusuri secara khusus maka dapat ditemukan konten-konten pornografi dengan mudah.
Text mining adalah suatu proses penambangan data berupa teks yang dilakukan oleh komputer dimana data tersebut dapat memberikan informasi-informasi untuk dilakukan analisa keterhubungannya (Rustiana, D., and Rahayu, N., 2017). Sedangkan sentimen analisis adalah suatu riset yang mengelola opini-opini dari topik tertentu untuk menghasilkan nilai positif, negatif, dan netral dari topik tersebut. Adapun opini-opini tersebut didapatkan melalui penambangan data dokumen, website, atau media social. Di Indonesia sendiri pengguna twitter pada tahun 2016 mencapai sekitar 24 juta pengguna aktif. Hal ini membuat twitter menjadi sumber daya data yang besar(Zulfa & Winarko, 2017).
Dengan ketenaran twitter tersebut tidak heran dengan jumlah tweet yang yang dibagikan oleh pengguna twitter tiap detiknya, jika kumpulan tweet tersebut diolah dengan bagik maka dapat diperoleh nilai atau kualitas dari informasi yang terdapat dalamtweettersebut(Sari, F. V., & Wibowo, 2019).
METODE PENELITIAN 2.1 Penentuan Hashtag
Penelitian ini dimulai dengan menganalisis dan menentukan hashtag (#) yang sering muncul di Twitter yang berkaitan dengan pornografi di Indonesia. Hashtag pada Twitter membantu dalam mengumpulkan data tweet sehingga data penelitian akan lebih terarah. Terdapat satu hashtag yang dipilih dalam penelitian ini yaitu #bokep.
2.2 Pengumpulan Data
Pengumpulan data dilakukan berdasarkan hashtag Twitter yang telah dipilih. Data didapat dengan mengunakan Twitter API dengan tools yang digunakan yaitu R Studio versi 1.2.5042. Hashtag pada Twitter membantu dalam mengumpulkan data tweet sehingga data penelitian akan lebih terarah yang dimana hashtag terdiri dari 500 data.
Proses pengumpulan data dimulai dari mengatur Twitter API di RStudio. Diperlukan
packages twitter, ROAuth, tm, dan syuzhet. Setelah itu, kita perlu memasukkan access token, access token secret, api key, dan api secret key yang didapat dari akun developer.twitter. Kemudian Twitter API dihubungkan ke internet untuk login twitter. Langkah berikutnya adalah memasukkan hashtag. Disini hashtag yang digunakan #bokep. Setelah data terkumpul berikut merupakan tampilannya
Karena yang dibutuhkan hanyalah textnya maka selanjutnya data text yang ada RT dan @ dihapus agar data benar benar berupa kalimat saja. Data dalam Rstudio kemudian ditampilkan dalam bentuk wordcloud. Tabel 1 menunjukkan beberapa contoh data tweet dengan hashtag #bokep
Tweet avail vcs berbayar 😘 200k60min lineakunvcsonly wa avail vcs berbayar no tiputipu💍 real account💯full body jenna suster bruan download vcsreal vcscolmek vcscrot ready ya 081230087529 shemalesurabaya bosurabaya yuk vcs vcs vcsbugil memek bokep
Tujuan dari preproccesing adalah untuk membersihkan data, menghilangkan tweet yang muncul berulang, dan membakukan kalimat yang tidak baku sehingga mendapatkan data bersih. Tahap preprocessing dalam penelitian ini sebagai berikut :
a. Seleksi Komentar
Data yang telah dikumpulkan pada tahap pengumpulan data ternyata ada data yang berulang dikarenakan adanya re-tweet tanpa diberikan komentar. Re-tweet merupakan salah satu fitur Twitter untuk membagikan tweet milik orang lain. Data-data yang berulang diseleksi dan dihapus untuk memaksimalkan penelitian. Hasil seleksi komentar didapatkan data-data yang akan digunakan dalam penelitian.
b. Cleaning
Cleaning merupakan proses pembersihan tiap tweet dari hal-hal yang tidak dibutuhkan dalam penelitian. Beberapa hal yang akan dilakukan proses cleaning pada penelitian ini yaitu hashtag, username (@username), dan URL (http://www.website.com).
c. Tokenisasi
Proses tokenisasi merupakan proses memecahkan data menggunakan spasi untuk dijadikan token-token. Proses ini merupakan proses akhir untuk mendapatkan data yang akan diolah untuk sentimen analisis.
HASIL DAN PEMBAHASAN
Penelitian ini bertujuan untuk mengetahui sentiment analisis dari tweet pornografi di Twitter. Selain itu, hasilnya juga mengingatkan masyarakat Indonesia untuk menggunakan media social secara tepat, bijak, dan untuk hal – hal yang bernilai positif.
Penelitian ini melakukan sentiment analisis dengan menguji 500 data tweet. Hasil pengujian ditunjukkan pada gambar dibawah
Berdasarkan hasil sentiment analisis dan pengujian maka diketahui bahwa penggunaan Twitter secara bebas membuat orang berani menawarkan dirinya dan semakin membuka identitas diri kepada banyak orang. Pengamatan secara langsung ke data tweet ditemukan bahwa twitter menjadi sarana yang baik untuk saling berkomunikasi dan bertransaksi diantaranya adalah mencari video call seks, ajakan untuk melakukan hubungan seks, dan saling berbagi foto seks.
Penyebaran informasi, foto, dan video yang berkaitan dengan pornografi dapat ditemukan dengan mudah di twitter. Penggunaan twitter secara luas dan bebas membuat twitter menjadi media yang dapat meningkatkan pengaksesan pornografi di Indonesia. Peningkatan tersebut tentunya akan memicu terjadinya kejahatan seksual dan berbagai kejahatan lainnya. Hasil penelitian ini mengingatkan kepada para pengguna twitter untuk lebih selektif dan kritis dalam penggunaannya
KESIMPULAN DAN SARAN
Berdasarkan penelitian yang telah dilakukan maka didapat kesimpulan bahwa penelitian ini menggunakan hashtag #bokep yang berkaitan dengan pornografi untuk mendapatkan data dari Twitter. Hasil sentimen analisis terhadap hashtag tersebut menunjukkan bahwa Twitter menjadi
salah satu media berkomunikasi dan transaksi seks di Indonesia. Kehadiran Twitter membantu untuk membuka diri dan saling berbagi hal-hal negatif dengan sesama.
DAFTAR PUSTAKA
Sari, F. V., & Wibowo, A. (2019). Analisis Sentimen Pelanggan Toko Online Jd. Id
Menggunakan Metode Naïve Bayes Classifier Berbasis Konversi Ikon Emosi. Simetris: Jurnal Teknik Mesin, Elektro Dan Ilmu Komputer, 2(2), 681–686.
Zulfa, I., & Winarko, E. (2017). Sentimen Analisis Tweet Berbahasa Indonesia Dengan Deep Belief Network. IJCCS (Indonesian Journal of Computing and Cybernetics Systems),
11(2), 187. https://doi.org/10.22146/ijccs.24716
Maulana, A., (2017). “Twitter Rahasiakan Jumlah Pengguna di Indonesia”. Tersedia: https://www.cnnindonesia.com/teknologi/20160322085045-185-118939/twitter-
rahasiakan-jumlah-pengguna-di-indonesia/. Diakses: 10 November 2017.
Rustiana, D., and Rahayu, N., 2017. “Analisa Sentimen Pasar Otomotif Mobil: Tweet Twitter menggunakan Naïve Bayes”, Jurnal Simetris 8. 1, 113-120.