• Tidak ada hasil yang ditemukan

PROGRAM STUDI MATEMATIKA FAKULTAS SAINS DAN TEKNOLOGI UIN SYARIF HIDAYATULLAH JAKARTA 2019 M / 1440

N/A
N/A
Protected

Academic year: 2022

Membagikan "PROGRAM STUDI MATEMATIKA FAKULTAS SAINS DAN TEKNOLOGI UIN SYARIF HIDAYATULLAH JAKARTA 2019 M / 1440"

Copied!
64
0
0

Teks penuh

(1)

EVALUASI PERPLEXITY UNTUK PEMODELAN TOPIK DISKUSI AGAMA ISLAM DI MEDIA SOSIAL TWITTER INDONESIA TAHUN 2006-2018 MENGGUNAKAN

LATENT DIRICHLET ALLOCATION

SKRIPSI

Trias Santika 11140940000020

PROGRAM STUDI MATEMATIKA FAKULTAS SAINS DAN TEKNOLOGI UIN SYARIF HIDAYATULLAH JAKARTA

2019 M / 1440

(2)

i

EVALUASI PERPLEXITY UNTUK PEMODELAN TOPIK DISKUSI AGAMA ISLAM DI MEDIA SOSIAL TWITTER INDONESIA TAHUN 2006-2018 MENGGUNAKAN

LATENT DIRICHLET ALLOCATION

Skripsi

Diajukan kepada

Universitas Islam Negeri Syarif Hidayatullah Jakarta Fakultas Sains dan Teknologi

Untuk Memenuhi Salah Satu Persyaratan dalam Memperoleh Gelar Sarjana Matematika (S.Mat)

Oleh:

Trias Santika 11140940000020

PROGRAM STUDI MATEMATIKA FAKULTAS SAINS DAN TEKNOLOGI UIN SYARIF HIDAYATULLAH JAKARTA

2019 M / 1440 H

(3)

ii

LEMBAR PENGESAHAN

Skripsi ini berjudul “Evaluasi Perplexity Untuk Pemodelan Topik Diskusi Agama Islam Di Media Sosial Twitter Indonesia Tahun 2006-2018 Menggunakan Latent Dirichlet Allocataion” yang ditulis oleh Trias Santika NIM.11140940000020 telah diuji dan dinyatakan lulus dalam sidang Munaqosah Fakultas Sains dan Teknologi Universitas Islam Negeri Syarif Hidayatullah Jakarta pada hari Rabu, 18 Desember 2019. Skripsi ini telah diterima untuk memenuhi salah satu persyaratan dalam memperoleh gelar sarjana strata satu (S1) Program Studi Matematika.

(4)

iii

PERNYATAAN

DENGAN INI SAYA MENYATAKAN BAHWA SKRIPSI INI BENAR- BENAR HASIL KARYA SENDIRI YANG BELUM PERNAH DIAJUKAN SEBAGAI SKRIPSI ATAU KARYA ILMIAH PADA PERGURUAN TINGGI ATAU LEMBAGA MANAPUN.

Jakarta, 18 Desember 2019

Trias Santika NIM.11140940000020

(5)

iv

LEMBAR PERNYATAAN PERSETUJUAN

PUBLIKASI KARYA ILMIAH UNTUK KEPENTINGAN AKADEMIS

Yang bertanda tangan di bawah ini:

Nama : Trias Santika NIM : 11140940000020

Program Studi : Matematika Fakultas Sains dan Teknologi

Demi pengembangan ilmu pengetahuan, saya menyetujui untuk memberikan Hak Bebas Royalti Non-Eksklusif (Non-Exclusive-Free Right) kepada Program Studi Matematika Fakultas Sains dan Teknologi UIN Syarif Hidayatullah Jakarta atas karya ilmiah saya yang berjudul :

“Evaluasi Perplexity Untuk Pemodelan Topik Diskusi Agama Islam Di Media Sosial Twitter Indonesia Tahun 2006-2018 Menggunakan Latent Dirichlet

Allocation”

beserta perangkat yang diperlukan (bila ada). Dengan Hak Bebas Royalti Non- Eksklusif ini, Program Studi Matematika Fakultas Sains dan Teknologi UIN Syarif Hidayatullah Jakarta berhak menyimpan, mengalihmedia/formatkan, mengelolanya dalam bentuk pangkalan data (database), mendistribusikannnya, dan menampilkan/mempublikasikannya di internet dan media lain untuk kepentingan akademis tanpa perlu meminta izin dari saya selama tetap mencantumkan nama saya sebagai penulis/pencipta dan sebagai pemilik Hak Cipta. Segala bentuk tuntutan hukum yang timbul atas pelanggaran Hak Cipta karya ilmiah ini menjadi tangung jawab saya sebagai penulis.

Demikian pernyataan ini yang saya buat dengan sebenarnya.

Dinyatakan di Tangerang Selatan Pada tanggal: 18 Desember 2019

Yang membuat pernyataan

(Trias Santika)

(6)

v

PERSEMBAHAN DAN MOTTO

Untuk kedua orang tua ku tercinta, Safrudin Nazibah

dan

Untuk kakak dan adikku, Rifqi Handrian Rivan dwi aprian Syaqila refalina

(7)

vi

ABSTRAK

Trias Santika, Evaluasi Perplexity Untuk Pemodelan Topik Diskusi Agama Islam Di Media Sosial Twitter Indonesia Tahun 2006-2018 Menggunakan Latent Dirichlet Allocation, di bawah bimbingan Dr. Taufik Edy Sutanto, MscTech dan Muhaza Liebenlito, M.Si.

Pembicaraan mengenai topik terkait diskusi agama Islam di Indonesia khususnya di media sosial twitter cukup banyak dengan jumlah teks mencapai 421.053 tweet. Skripsi ini menggunakan data tersebut yang diambil dari Maret 2006 hingga November 2018. Pada penelitian ini akan diamati pola perubahan perbincangan masyarakat di media sosial twitter ketika membicarakan agama Islam di setiap tahunnya dengan menggunakan metode LDA dimana jumlah topik optimal yang didapatkan menggunakan evaluasi perplexity. Hasil penelitian menunjukkan bahwa masing-masing tahun memiliki dua topik optimal. Lebih jauh lagi, probabilitas kata-kata terkait agama Islam selalu muncul di setiap tahunnya namun terdapat pula kata-kata yang lebih berkaitan dengan politik sering lebih muncul di mulai pada tahun 2016. Hal ini menunjukkan pada masa ini pengguna twitter sudah tidak lagi murni membicarakan agama Islam di media sosial tetapi sudah mencampurnya dengan kata-kata yang berhubungan dengan politik.

Kata Kunci: bar chart, LDA, perplexity, topic modelling

(8)

vii

ABSTRACT

Trias Santika, Evaluation Perplexity For Topic Modelling Of Discussion Of Islam On Indonesian Media Social Twiter 2006-2018 Using Latent Dirichlet Allocation, under the guidance of Dr. Taufik Edy Sutanto, MscTech dan Muhaza Liebenlito, M.Si.

This research will bring up a topic discussion related to Islam as a religion in Indonesia specifically on social media twitter, which has almost 421.053 tweets. This thesis will observe the changing pattern in topic distribution using LDA method where the number of optimal topics that are received will use perplexity evaluation. The result shows that each year, there are two optimal topics. Furthermore, the topics of words related to Islam religion appear every single year, but more political oriented words arise starting from 2016. It shows that nowadays, the twitter users are no longer purely discuss Islam religion on social media but it has been filled with political words.

Keywords: bar chart, LDA, perplexity, topic modelling

(9)

viii

KATA PENGANTAR

Assalamu’alaikum Warahmatullahi Wabaraktuh

Alhamdulillah, puji dan syukur kehadirat Allah SWT atas segala limpahan rahmat dan hidayah-Nya sehingga penulis dapat menyelesaikan penulisan skripsi yang berjudul “Evaluasi Perplexity Untuk Pemodelan Topik Diskusi Agama Islam Di Media Sosial Twitter Indonesia Tahun 2006-2018 Menggunakan Latent Dirichlet Allocation”. Shalawat serta salam senantiasa tercurahkan kepada bagina Nabi Muhammad SAW, beserta keluarga dan para sahabatnya.

Di balik terselesaikannya skripsi ini, begitu banyak pihak yang telah berkontribusi, baik dalam memberikan bimbingan, bantuan, waktu, maupun dalam bentuk kontribusi lainnya. Untuk itu melalui kesempatan ini, dengan segala kerendahan hati, penulis ingin menyampaikan terima kasih kepada:

1. Ibu Dr. Lily Surraya Eka Putri, M.Env.Stud selaku Dekan Fakultas Sains dan Teknologi Universitas Islam Negeri Syarif Hidayatullah Jakarta.

2. Ibu Suma’inna, M.Si selaku Ketua Program Studi Matematika dan Ibu Irma Fauziah, M.Sc selaku Sekretaris Program Studi Matematika.

3. Bapak Taufik Edy Sutanto, MscTech selaku Dosen Pembimbing I dan Bapak Muhaza Liebenlito, M.Si selaku Dosen Pembimbing II yang senantiasa memberikan waktu, bimbingan, dan motivasi kepada penulis dalam menyelesaikan skripsi ini.

4. Ibu Dr. Nina Fitriyati, M.Kom selaku Dosen Penguji I dan Ibu Yanne Irene, M.Si selaku Dosen Penguji II yang telah memberikan saran dan arahan untuk perbaikan skripsi ini.

5. Seluruh Ibu dan Bapak Dosen Program Studi Matematika yang telah memberikan ilmu dan pengetahuan yang bermanfaat selama masa studi penulis.

6. Kedua orang tuaku Safrudin dan Nazibah yang tak lelah memberikan semangat kepada penulis.

(10)

ix 7. Kedua kakak ku Rivan dan Rifqi serta adikku Syaqila yang selalu

menghibur penulis.

8. Woro, Laili, dan Nida yang selalu memberikan motivasi dan semangat yang tak henti kepada penulis.

9. Desi, Fatwa, Heni, dan Bimo yang selalu menemani penulis selama penyelesaian skripsi.

10. Teman – teman seperjuangan Finex Family yang sudah menemani penulis dari awal perkuliahan.

Penulis menyadari bahwa masih banyak kesalahan dalam penulisan skripsi ini. Oleh sebab itu, penulis menerima kritik dan saran yang bersifat membangun agar kesalahan yang terjadi tidak terulang lagi di masa yang akan datang. Penulis berharap bahwa skripsi ini bermanfaat bagi banyak pihak.

Jakarta, 18 Desember 2019

Penulis

(11)

x

DAFTAR ISI

HALAMAN JUDUL ... i

LEMBAR PENGESAHAN ... ii

PERNYATAAN KEASLIAN ... iii

PERNYATAAN PERSETUJUAN PUBLIKASI ... iv

PERSEMBAHAN DAN MOTTO ... v

ABSTRAK ... vi

ABSTRACT ... vii

KATA PENGANTAR ... viii

DAFTAR ISI ... x

DAFTAR GAMBAR ... xii

BAB I PENDAHULUAN ... 1

1.1. Latar Belakang ... 1

1.2. Rumusan Masalah ... 3

1.3. Batasan Masalah ... 3

1.4. Tujuan Penelitian ... 4

1.5. Manfaat Penelitian ... 4

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI ... 5

2.1. Islam, Hadits, dan Al-Qur’an ... 5

2.2. Topic Modelling ... 6

2.3. Evaluasi Topic Modelling ... 6

2.4. Part-of-Speech Tagging ... 8

2.4. Vector Space Model ... 9

BAB III METODOLOGI PENELITIAN ... 10

(12)

xi

3.1. Pengumpulan Data ... 10

3.2. Tahapan Penelitian ... 12

3.3. Alur Penelitian ... 15

BAB IV HASIL DAN PEMBAHASAN ... 17

4.1. Deskriptif Analitik ... 17

4.2. Analisis Topik ... 19

4.3. Analisis Topik terhadap Waktu ... 21

4.4. Analisis Topik Secara Keseluruhan ... 42

BAB V KESIMPULAN DAN SARAN ... 44

5.1. Kesimpulan ... 44

5.2. Saran ... 44

REFERENSI ... 45

(13)

xii

DAFTAR GAMBAR

Gambar 1. 1. Jumlah penduduk Indonesia berdasarkan agama yang dianut ... 1

Gambar 2. 1. Evaluasi topic modelling ... 7

Gambar 2. 2. Data pendefinisian tag [20] ... 9

Gambar 3. 1. Jumlah tweet pertahun pada tahun 2006 hingga 2018 ... 10

Gambar 3. 2. Representasi model grafis LDA ... 13

Gambar 3. 3. Alur penelitian ... 16

Gambar 4. 1. Nilai perplexity tahun 2007 ... 17

Gambar 4. 2. Visualisasi tahun 2016 yang memiliki 2 topik ... 18

Gambar 4. 3. Visualisasi tahun 2016 yang memiliki 3 topik ... 19

Gambar 4. 4. Visualisasi tahun 2006-2018 ... 20

Gambar 4. 5. Wordcloud dan wordlink tahun 2006-2018 ... 21

Gambar 4. 6. Visualisasi tahun 2007 ... 21

Gambar 4. 7. Wordcloud dan wordlink tahun 2007 ... 22

Gambar 4. 8. Visualisasi tahun 2008 ... 23

Gambar 4. 9. Wordcloud dan wordlink tahun 2008 ... 23

Gambar 4. 10. Visualisasi tahun 2009 ... 24

Gambar 4. 11. Wordcloud dan wordlink tahun 2009 ... 26

Gambar 4. 12. Visualisasi tahun 2010 ... 26

Gambar 4. 13. Wordcloud dan wordlink tahun 2010 ... 28

Gambar 4. 14. Visualisasi tahun 2011 ... 28

Gambar 4. 15. Wordcloud dan wordlink tahun 2011 ... 29

Gambar 4. 16. Visualisasi tahun 2012 ... 30

Gambar 4. 17. Wordcloud dan wordlink tahun 2012 ... 31

Gambar 4. 18. Visualisasi tahun 2013 ... 32

Gambar 4. 19. Wordcloud dan wordlink tahun 2013 ... 33

Gambar 4. 20. Visualisasi tahun 2014 ... 33

Gambar 4. 21. Wordcloud dan wordlink tahun 2014 ... 34

Gambar 4. 22. Visualisasi tahun 2015 ... 35

Gambar 4. 23. Wordcloud dan wordlink tahun 2015 ... 36

(14)

xiii

Gambar 4. 24. Visualisasi tahun 2016 ... 37

Gambar 4. 25. Wordcloud dan wordlink tahun 2016 ... 38

Gambar 4. 26. Visualisasi tahun 2017 ... 39

Gambar 4. 27. Wordcloud dan wordlink tahun 2017 ... 40

Gambar 4. 28. Visualisasi tahun 2018 ... 41

Gambar 4. 29. Wordcloud dan wordlink tahun 2018 ... 42

Gambar 4. 30. Analisis topik secara keseluruhan ... 43

(15)

1 BAB I PENDAHULUAN

1.1. Latar Belakang

Indonesia adalah salah satu negara yang memiliki banyak keragaman didalamnya seperti adanya suku bangsa dan ras, budaya, dan juga kepercayaan agama. Banyak agama yang dianut di Indonesia seperti Islam, Kristen, Budha, dan sebagainya yang dapat dilihat pada Gambar 1.1. namun menurut Badan Pusat Statistik agama yang paling banyak dianut di Indonesia adalah agama Islam.

Indonesia ini merupakan negara yang berlandaskan pancasila dimana sangat menjunjung tinggi nilai keagamaannya, namun karena banyaknya perbedaan agama di Indonesia tidak banyak masyarakat yang tetap menjunjung tinggi nilai keagamaan dan tidak menjaga agar perbedaan tersebut menjadi konflik.

Berdasarkan kajian Ihsan Ali-Fauzi dkk, isu-isu keagamaan yang menyebabkan konflik di Indonesia terdiri dari enam kategori, salah satu nya disebut isu kommunal, yaitu isu-isu yang melibatkan perseteruan antar komunitas agama, seperti konflik muslim-kristen yang tidak selalu bisa diidentifikasi berasal dari kelompok agama tertentu [1]. Ada pula isu terorisme, yaitu isu yang terkait dengan aksi-aksi serangan terror dengan sasaran kelompok keagamaan atau hak milik kelompok agama tertentu [1].

Gambar 1. 1. Jumlah penduduk Indonesia berdasarkan agama yang dianut

0 50.000.000 100.000.000 150.000.000 200.000.000 250.000.000

Jumlah penduduk (jiwa)

Agama

Jumlah Penduduk di Indonesia berdasarkan agama yang dianut

Jumlah Penduduk (Jiwa)

(16)

2

“Dan berpegang teguhlah kamu semuanya pada tali (agama) Allah, dan jangan lah kamu bercerai berai, dan ingatlah nikmat Allah kepadamu ketika kamu dahulu (masa Jahiliah) bermusuhan, lalu Allah mempersatukan hatimu, sehingga dengan karunia-Nya kamu menjadi bersaudara,……” (QS. Ali Imran:103)

Berdasarkan tafsir kementrian agama Republik Indonesia mengenai ayat diatas yang menjelaskan pada ayat ini Allah memerintah kaum mukmin menjaga persatuan dan kesatuan dan berpegang teguhlah serta berusahalah sekuat tenaga agar kamu semuanya bantu-membantu untuk menyatu pada tali (agama) Allah agar kamu tidak tergelincir dari agama tersebut dan janganlah kamu bercerai berai, saling bermusuhan dan mendengki, karena semua itu akan menjadikan kamu lemah dan mudah dihancurkan. Artinya pada masa ini banyak masyarakat yang saling menyerang dan menjatuhkan, beradu argumen tetapi tidak mencari titik penyelesaian melainkan menunjukkan keegoannya masing-masing, dan banyak juga yang membawa agama dalam konflik tersebut khususnya di media sosial.

Pembicaraan mengenai agama Islam terdiri dari pembicaraan positif dan negatif. Pembicaraan positif yang sering dibicarakan dalam masyarakat seperti menyebarkan dakwah Islam secara benar. Akan tetapi agama Islam merupakan agama yang paling banyak mengalami konflik internal [2]. Perbedaan pandangan dalam ajaran agama Islam bisa menimbulkan konflik, perbedaan yang nampak dan nyata salah satunya adalah perbedaan madzhab. Walaupun satu aqidah yaitu aqidah Islam tetapi perbedaan penafsiran dan penghayatan terhadap al-qur’an terbukti dapat memecahkan internal umat Islam. Banyaknya pembicaraan mengenai agama Islam membuat peneliti ingin mengetahui apa saja topik yang dibicarakan setiap tahunnya khusunya di media sosial twitter, namun karena banyaknya tweet yang terkait diskusi agama Islam tidak memungkinkan peneliti tidak melakukan nya secara manual. Maka dibutuhkan pemodelan topik salah satunya dengan menggunakan metode Latent Dirichlet Allocation (LDA) yang

(17)

3 melakukan pengidentifikasian informasi topik laten (tersembunyi) dengan menyatukan kata, topik dan konteks secara bersamaan.

Pemodelan topik pada penelitian ini dilakukan berdasarkan urutan waktu untuk melihat hubungan topik terhadap waktu [3] dan LDA merupakan metode yang efektif dalam pemodelan topik, bahkan terdapat banyak pengembangan aplikasi dari LDA [4][5]. Pada penelitian ini akan dilakukan hal yang serupa yaitu menggunakan metode LDA dalam pemahaman teks di media sosial khususnya twitter namun perbedaannya yaitu pada topik terkait diskusi agama Islam di Indonesia dan menambahkan evaluasi untuk menemukan optimal model.

1.2. Rumusan Masalah

Dari uraian latar belakang di atas, maka didapat perumusan masalah sebagai berikut:

1. Apa saja topik yang dibicarakan pengguna media sosial twitter terkait diskusi agama Islam di Indonesia?

2. Berapa jumlah topik optimal yang didapat untuk setiap model di setiap tahunnya?

3. Jika dilihat dari informasi waktu dan topik yang terbentuk, bagaimana pola topik agama Islam dari tahun 2006 hingga 2018?

1.3. Batasan Masalah

Agar permasalahan tidak menyimpang dari yang sudah ditetapkan, maka dibuat pembatasan masalah sebagai berikut:

1. Data diambil dari media sosial yaitu twitter. Topik permasalahan yang diamati terkait agama Islam di Indonesia dari 21 Maret 2006 sampai 30 November 2018.

2. Data yang diolah hanya data teks, data yang berupa gambar, video, alamat sumber dan informasi lainnya diabaikan.

3. Kata kunci pencarian data yang digunakan dalam penelitian ini yaitu

“Islam, hadis, hadits, al quran, al qur’an, al-qur’an, al-quran, qur’an, quran”

(18)

4 1.4. Tujuan Penelitian

Tujuan yang ingin dicapai dalam penelitian ini adalah

1. Memperoleh topik yang dibicarakan pengguna media sosial twitter terkait diskusi agama Islam di Indonesia.

2. Mendapatkan jumlah topik optimal yang didapat untuk model untuk setiap tahunnya.

3. Mengetahui pembicaraan topik terkait diskusi agama Islam di Indonesia dari tahun 2006 hingga 2018.

1.5. Manfaat Penelitian

Melalui penelitian ini diharapkan dapat menjadi acuan untuk penelitian atau pengembangan dalam penanganan permasalahan agama Islam. Masyarakat pengguna media sosial dapat menghindari konflik sosial di masyarakat terutama terkait diskusi agama Islam dan kehidupan beragama, dan dapat membandingkan pemodelan topik yang mempertimbangkan waktu sebagai salah satu variabel.

(19)

5 BAB II

TINJAUAN PUSTAKA DAN LANDASAN TEORI

Pada Bab ini akan membahas beberapa teori mengenai penelitian ini, seperti pengetahuan terkait topik diskusi agama Islam dan beberapa metode yang berkaitan dan beberapa istilah yang digunakan pada penelitian ini.

2.1. Islam, Hadits, dan Al-Qur’an

Islam dapat dikatakan sebagai agama tauhid yang diturunkan Allah SWT kepada Nabi Muhammad SAW, dimana sejarah Islam sendiri dimulai sejak Allah SWT menciptakan Adam dari tanah dan meniupkan ruh serta mengajarkan nama- nama benda kepadanya sampai akhirnya Adam diturunkan ke bumi karena tergoda oleh tipu daya iblis [6]. Allah SWT menurunkan kitab suci yang terakhir kepada Nabi Muhammad SAW untuk disampaikan kepada umat manusia sampai pada akhir zaman, kitab suci tersebut dinamai Al-Qur’an [7] yang merupakan salah satu sumber hukum Islam, dimana sumber hukum Islam yang lainnya yaitu as-Sunnah, ijma’, dan qiyas [6]. Sumber hukum Islam terbagi menjadi 2 yaitu sumber asal dan sumber cabang, dan yang dimaksud sumber asal yaitu Al-Qur’an dan as-Sunnah atau yang biasa disebut sebagai Hadits ini adalah segala hal yang bersumber dari Rasulullah baik berupa ucapan, perbuatan, maupun pengakuan dengan diam selain Al-Qur’an [6].

Islam, Al-Qur’an, dan Hadits merupakan kata-kata yang dapat menggambarkan agama Islam karena Islam merupakan salah satu agama yang dapat dianut dan Al-Qur’an dan Hadits merupakan dua sumber utama ajaran Islam [8], sehingga ketiga kata tersebut saling berkaitan. Karena sebagian besar orang Indonesia beragama Islam dan memiliki twitter, ketiga kata tersebut sering muncul dalam perbincangan para pengguna twitter jika sedang membahas topik terkait agama.

(20)

6 2.2. Topic Modelling

Topic Modelling adalah algoritma untuk menemukan tema utama yang meliputi koleksi dokumen yang besar dan tidak terstruktur, dan dapat mengatur koleksi sesuai dengan tema yang ditemukan [9]. Algoritma pemodelan topik dapat disesuaikan dengan berbagai jenis data untuk menemukan pola seperti data genetik, gambar, dan jejaring social [9]. Terdapat beberapa bentuk algoritma pemodelan topik diantaranya yaitu Latent Semantic Analysis (LSA) yang merupakan pendekatan pengindeksian otomatis dan pencarian informasi yang berupaya mengatasi masalah ini dengan memetakan dokumen serta istilah untuk representasi dalam ruang semantik laten [10]. Representasi ini memungkinkan perhitungan kesamaan antara istilah dan dokumen, kategorisasi istilah dan dokumen, dan meringkas koleksi besar dokumen menggunakan prosedur otomatis yang meniru cara manusia melakukan tugas kognitif serupa [11]. Kemudian dilakukan pendekatan baru untuk pengindeksian dokumen otomatis yang didasarkan pada model kelas laten statistik untuk analisis faktor data hitungan yang disebut Probabilistic Latent Semantic Analysis (PLSA) [12]. PLSA adalah teknik statistik untuk analisis dua mode dan daa kejadian bersama, yang memiliki aplikasi dalam pencarian dan penyaringan informasi, pemrosesan bahasa alami, pembelajaran mesin dari teks, dan di bidang terkait [13]. Dikembangkan lagi metode baru dari permasalahan kedua algoritma tersebut apabila terdapat matriks pembobotan kata memiliki nilai yang negative, yaitu metode Non-Negative Matrix Factorization (NMF) [14]. Kemudian algoritma topic modelling terus berkembang untuk memperoleh hasil yang lebih baik salah satu algoritma nya adalah LDA yang merupakan model probabilistic generative dari sebuah corpus, yang ide dasarnya adalah bahwa dokumen direpresentasikan sebagai campuran acak atas topik laten dimana setiap topik ditandai dengan distribusi kata-kata [15].

2.3. Evaluasi Topic Modelling

Evaluasi model dalam clustering lebih menantang daripada mengevaluasi dalam klasifikasi karena di dalam klasifikasi sudah terdapat label dan dapat menghitung statistik kinerja nya seperti akurasi. Sedangkan, dalam clustering

(21)

7 tidak terdapat label dan hanya dapat mendasarkan perkiraan kualitas pada data dan partisi yang sedang dipertimbangkan [16]. Untuk memilih clustering terbaik dari solusi yang dihasilkan dapat menggunakan langkah-langkah internal validity.

Langkah-langkah internal validity mengukur kualitas clustering yang hanya mengandalkan sifat intrinsik untuk data, agar strategi ini valid memerlukan ukuran internal yang memungkinkan perbandingan yang adil antara algoritma clustering [16].

Penentuan jumlah topik merupakan hal yang penting untuk diperhatikan dalam clustering. Dengan penentuan jumlah topik yang sesuai maka didapat hasil yang menjadi lebih optimal dan valid sehingga mudah untuk diinterpretasikan.

Cara penentuan jumlah topik dapat dilakukan menggunakan topic coherence.

Topic coherence menangkap informasi semantik dari topik yang dihasilkan dan menilai interpretasi topik tersebut. Perhitungan topic coherence dilakukan dengan membandingkan berpasangan antar kata dalam topik tertentu yang mana menghasilkan ukuran standar kualitas suatu topik, semakin tinggi nilai coherence akan semakin baik modelnya [17]. Cara lain untuk menentukan jumlah topik dan cara yang paling umum digunakan adalah perplexity. Perplexity merupakan sebuah metric untuk menguji ketepatan informasi dari dokumen terhadap topik yang dihasilkan. Perhitungan perplexity dilakukan dengan menentukan kemungkinan dari log teks dokumen yang tidak terlihat, semakin rendah nilai perplexity semakin baik model yang dihasilkan [18]. Berikut beberapa evaluasi untuk topic modelling:

Evaluasi Model

Semantic Coherence [17]

Internal Validity [16]

Perplexity [18]

Gambar 2. 1. Evaluasi topic modelling

(22)

8 2.4. Part-of-Speech Tagging

Selain noisy yang menjadi permasalahan kualitas data twitter dari perolehan hasil scraping ada juga permasalahan lainnya yaitu banyaknya kata-kata yang kurang informatif untuk topik yang diamati sehingga mengakibatkan berkurangnya frekuensi kata yang lebih informatif dalam menggambarkan topik.

Oleh karena itu dibutuhkan proses penyaringan data seperti mengambil kata-kata yang informatif terhadap topik saja, salah satu prosesnya menggunakan Part-of- Speech (POS) Tagging. POS Tagging, yang disebut juga dengan grammatical tagging adalah proses menetapkan POS tag ke kata-kata-kata dalam teks [19]

POS tag adalah kategori grammatical, umumnya termasuk kata kerja, kata benda, kata sifat, kata keterangan, dan sebagainya [19]. POS tag adalah alat penting dalam banyak aplikasi pemrosesan bahasa alami seperti disambugasi kata, parsing, jawaban pertanyaan, dan terjemahan mesin [19].

Karena pada penelitian ini menggunakan bahasa Indonesia maka dibutuhkan pendefinisian tag untuk kata-kata yang berbahasa Indonesia saja, di mana pendefinisian tag ini memiliki beberapa referensi. Maka daftar tag yang dijadikan pendefinisain tag kali ini yaitu dengan mendefinisikan 45 tag untuk kata-kata bahasa Indonesia termasuk tanda baca dan simbol. Data pendefinisian tag kali ini terlihat pada Gambar 2.2.

(23)

9 Gambar 2. 2. Data pendefinisian tag [20]

2.4. Vector Space Model

Dalam sebuah penelitian pada teks terdapat suatu kemiripan antara dokumen dengan query, untuk mengukur kemiripan tersebut dibutuhkan model yang disebut Vector Space Model (VSM). VSM adalah salah satu model pengambilan klasik dan banyak diterapkan untuk mengevaluasi relevansi halaman web, VSM mewakili dokumen dan query sebagai vektor dalam ruang multidimensi [21]. Dalam VSM terdapat tiga tahap prosedur, yang pertama adalah pengindeksian dokumen di mana istilah yang mengandung konten diekstraksi dari teks dokumen, tahap kedua adalah pembobotan istilah yang diindeks untuk meningkatkan pengambilan dokumen yang relevan bagi pengguna, indikator pentingnya pembobotan kata dikaitkan dengan tiga komponen yang mempengaruhi pentingnya suatu kata pada teks yaitu term frequency (tf), inverse document frequency (idf), dan normalisasi panjang dokumen [22]. Tahap yang terakhir memberi peringkat pada dokumen sehubungan dengan permintaan berdasarkan ukuran kesamaan [21].

(24)

10 BAB III

METODOLOGI PENELITIAN

Pada Bab ini akan dijelaskan mengenai pengumpulan data serta tahapan penelitian yang dipilih penulis untuk mendapatkan hasil pengolahan data terbaik.

3.1. Pengumpulan Data

Data pada penelitian ini menggunakan data sekunder berupa data tweet berbahasa Indonesia yang diambil mulai tanggal 21 Maret 2006 sampai pada tanggal 30 November 2018 dalam rentang waktu perbulan. Data ini diambil melalui fasilitas pencarian data tingkat lanjut (Twitter Search Advance) [23]

menggunakan akun twitter pribadi dengan kata kunci “Islam, hadist, hadits, hadis, quran, qur’an, al quran, al qur’an, al-qur’an, al-quran”. Kemudian data yang sudah diambil dalam waktu perbulan dengan lengkap sampai tweet terakhir pada bulan tersebut disimpan dalam bentuk halaman web atau Hyper Text Markup Language (HTML). Data dalam bentuk HTML diekstraksi menggunakan teknik Scrapping agar dapat dianalisa lebih lanjut dan dapat dijadikan sebuah informasi sebagai bahan penelitian. Data hasil dari Scrapping disimpan kedalam bentuk Comma Separated Values (CSV) dan data 2006-2018 yang sudah terkumpul dipecah dalam waktu pertahun untuk diamati. Berikut jumlah tweet pertahun pada Gambar 3.1.

0 39 57 1156 12618

31340 67750

98347

64389

40680 38171 35599 30907

Jumlah tweet pertahun

Jumlah Tweet

2006 2007 2008 2009 2010 2011 2012 2013 2014 2015 2016 2017 2018

Gambar 3. 1. Jumlah tweet pertahun pada tahun 2006 hingga 2018

(25)

11 Data yang sudah dipecah akan melalui proses preprocessing untuk membersihkan tweet dari data media sosial yang mengandung noise (singkatan, bentuk tidak beraturan) dan karakter yang sulit terbaca oleh komputer agar mudah diolah. Pada penelitian ini menggunakan proses preprocessing seperti penggunaan Lemmatization yang merupakan proses mencari transformasi untuk diterapkan pada sebuah kata untuk mendapatkan bentuk normalnya [24], melakukan isolasi atau pemecahan kata dari karakter asli dimana isolasi kata ini disebut Tokenization [25], melakukan Stopword Removal yang sudah dipaparkan pada Bab 2, menghapus simbol kecuali simbol “.” (titik) dan “,” (koma), penjabaran singkatan, memperbaiki kesalahan tipografi (typo), huruf kapital yang tidak beraturan, dan menghapus Uniform Resource Locator (URL). Data yang terkumpul tiap tahun memiliki jumlah baris yang berbeda-beda tetapi tiap tahun memiliki kolom yang sama yaitu kolom Time yang menunjukkan waktu pengguna membagikan tweet-nya, Username menunjukkan nama akun pengguna, Replies menunjukkan berapa banyak jumlah yang membalas tweet tersebut, Retweets menunjukkan berapa banyak akun yang membagikan kembali tweet, Likes menunjukkan berapa banyak tweet tersebut disukai, dan Tweet menunjukkan isi dari tweet yang sudah melalui tahap preprocessing seperti pada Lampiran III.

Dari data diperoleh beberapa informasi yang memperlihatkan tanggapan dan penilaian masyarakat di Indonesia terkait tentang agama Islam di media sosial twitter sangat tinggi seperti pada Tabel 3.1. yang menunjukkan bahwa tanggapan para pengguna twitter pada tweet terkait agama Islam maksimal sebanyak 3.684 tanggapan dari 1.249.221 jumlah tanggapan dengan rata-rata 2,9669. Kemudian untuk tweet yang dibagikan kembali oleh pengguna lain dapat dilihat dari jumlah retweet dimana pada data jumlah dari retweet maksimal sebanyak 49.473 retweet dari 28.865.475 jumlah retweet dengan rata-rata 68,5554. Jika dilihat dari berapa banyak yang menyukai tweet terkait agama Islam dapat dilihat dari likes dimana paling tinggi yang menyukai tweet terkait agama Islam sebesar 48.067 likes dari 17.917.485 jumlah likes dengan rata-rata 42,554.

(26)

12 Tabel 3. 1. Statistika Deskriptif

N Sum Minimum Maximum Mean

Replies 421.053 1.249.221 0 3.684 2,9669

Retweet 421.053 28.865.475 0 49.473 68,5554 Likes 421.053 17.917.485 0 48.067 42,554

3.2. Tahapan Penelitian

Setelah data siap diolah, kemudian data mulai dianalisa pertahun. Langkah pertama penganalisaan adalah membentuk model. Pembentukkan model yang dilakukan pada penelitian ini yaitu melakukan POS tagging, pembobotan kata membentuk model LDA, evaluasi, dan yang terakhir visualisasi dan interpretasi.

Berikut pemaparan pembentukkan model:

3.2.1. Melakukan POS Tagging

POS Tagging dilakukan hanya untuk mengambil kata dengan tanda NN, NNP, NNS, dan NNPS berdasarkan data pendefinisian POS tag, karena dengan tanda ini dapat lebih mudah untuk menemukan kata-kata penting pada topik.

3.2.2. Pembobotan Kata

Pembobotan kata adalah aspek penting dalam proses pengolahan data teks untuk melihat kata-kata penting pada teks karena kata yang berbeda memiliki kepentingan yang berbeda dalam sebuah teks, indicator pentingnya pembobotan kata dikaitkan dengan tiga komponen yang mempengaruhi pentingnya suatu kata pada teks yaitu term frequency (tf), inverse document frequency (idf), dan normalisasi panjang dokumen [22].

Pada penelitian kali ini yang digunakan hanya tf dan normalisasi panjang dokumen. tf merupakan banyaknya kata atau term yang muncul di dalam dokumen [26], sedangkan normalisasi panjang dokumen digunakan untuk menghilangkan keuntungan yang dimiliki dokumen panjang dalam pengambilan dokumen pendek, salah satu teknik normalisasi yang

(27)

13 digunakan dalam sistem pencarian informasi adalah Maximum tf dimana teknik maximum tf ini merupakan terknik normalisasi popular dengan batas maksimum faktor tf nya yaitu 1.0 [27], pada penelitian ini nilai maximum tf nya sebesar 0.75. Berikut rumus perhitungan untuk maximum tf [28]:

(

) (3.1)

3.2.3. Latent Dirichlet Allocation

LDA adalah salah satu metode soft clustering yang sering digunakan dalam teks untuk mendapatkan informasi. LDA merupakan teknik yang mengidentifikasi informasi topik laten (tersembunyi) dalam koleksi dokumen besar dengan menggunakan pendekatan “bag of word”

(representasi data teks) yang memperlakukan setiap dokumen sebagai vektor jumlah kata, setiap dokumen direpresentasikan sebagai distribusi probabilitas pada beberapa topik sedangkan setiap topik direpresentasikan sebagai probabilitas yang didistribusikan dalam sejumlah kata [4], dimana mewakili distribusi topik-dokumen dan mewakili distribusi kata-topik.

LDA memodelkan masing-masing dokumen D sebagai campuran dari topik laten K, masing-masing menggambarkan distribusi multinomial atas kosakata kata W. Gambar 3.2. menunjukkan representasi model grafis dari LDA. Untuk perhitungan LDA dapat dilihat pada [29].

Gambar 3. 2. Representasi model grafis LDA

(28)

14 3.2.4. Perplexity

Pada penelitian ini akan menggunakan evaluasi model untuk mendapatkan jumlah topik yang optimal setiap tahunnya tanpa melakukan pelatihan data. Cara paling umun untuk mengevaluasi model LDA yaitu perplexity [15]. Perplexity merupakan sebuah metric untuk menguji ketepatan informasi dari dokumen terhadap topik yang dihasilkan.

Perplexity dihitung dengan menentukan kemungkinan dari log teks dokumen yang tidak terlihat, dimana nilai perplexity yang lebih rendah berarti model yang lebih baik dan merekomendasikan lebih sedikit ketidakpastian tentang dokumen yang tidak terlihat [18]. Berikut perhitungan Perplexity [15]:

( ) { ∑ ( )

} (3.4)

Keterangan:

( ) Peluang total jumlah kata

Total jumlah kata dalam dokumen ke- Berikut contoh perhitungan nilai perplexity:

No Dokumen Jumlah Kata

1 Makan kalkun pada hari libur kalkun 6 2 Saya suka makan kue di hari libur 7 3 Perlombaan lari kalkun pada hari libur syukur 7

4 Film pada hari syukur 4

5 Calon bintang film 3

Total 27

(29)

15 untuk 5 dokumen dimana masing-masing kata di dalam dokumen berturut- turut yaitu 6,7,7,4,3 dan total jumlah kata terdapat 27 kata:

( ) { ∑ ( )

∑ }

( ) { ∑ ( )

∑ }

{ ( ( ) ( ) ( ) ( ) ( ))

}

{ ( ( ) ( ) ( ) ( ) ( ))

}

{ ( ( ) ( ) ( ) ( ) ( ))

}

{ (( ) ( ) ( ) ( ) ( ))

}

{ }

3.3. Alur Penelitian

Pada subbab ini akan diperlihatkan alur proses penelitian dari awal mendapatkan data sampai mendapatkan model yang siap untuk divisualisasikan dan diinterpretasikan terhadap data sesugguhnya. Berikut alur penelitian yang dapat dilihat pada Gambar 3.3.

(30)

16 Gambar 3. 3. Alur penelitian

Mulai Scrapping

(pengambilan data)

Preprocessing:

1. Lemmatization 2. Tokenization

3. Symbol Removals (kecuali “.” dan “,”) 4. URL Removals

5. Penjabaran singkatan, memperbaiki masalah tipografi (typo)

6. Stopword Removals

7. Melakukan POS tagging (hanya noun )

Data Pembagian

data pertahun

Pemodelan topik dengan LDA

Mencari k optimal dengan evaluasi perplexity

Visualisasi dan Interpretasi

Selesai

(31)

17 BAB IV

HASIL DAN PEMBAHASAN

Pada bab ini hasil evaluasi perplexity dan hasil implementasi model dalam bentuk bar chart akan dijelaskan lebih lanjut.

4.1. Deskriptif Analitik

Dalam penelitian ini untuk mendapatkan jumlah topik yang optimal menggunakan evaluasi perplexity dengan mencoba 11 kandidat jumlah topik yaitu 2,3,4,5,6,7,8,9,10,11, dan 12. Kandidat tersebut dipilih karena nilai perplexity yang dihasilkan jika jumlah topik lebih dari 12 tidak akan menghasilkan nilai terkecil karena lebih banyak topik lebih besar nilai perplexity, sedangkan jika jumlah topik kurang dari dua tidak dapat mewakili keseluruhan dokumen. Jumlah topik dengan nilai perplexity pada tahun 2007 dapat dilihat pada Gambar 4.1. dan jumlah topik dengan nilai perplexity untuk setiap tahun dilihat pada Lampiran IV.

Gambar 4. 1. Nilai perplexity tahun 2007

0 5 10 15 20 25

2 3 4 5 6 7 8 9 10 11 12

Jumlah Topik

Nilai perplexity tahun 2007

Nilai perplexity

(32)

18 Dari hasil evaluasi tersebut diperoleh jumlah topik yang optimal untuk setiap tahunnya yang masing-masing tahun memiliki dua topik, namun dua topik tersebut belum tentu mudah untuk diinterpretasikan. Berikut akan dilihat visualisasi tahun 2016 yang memiliki 2 topik dan 3 topik dan akan dilihat mana yang mudah untuk diinterpretasikan:

Dari hasil visualisasi tahun 2016 yang memilik 2 topik dapat diinterpretasikan bahwa topik 1 memiliki beberapa kata yang tidak berkaitan dengan islam seperti aksi bela, ahok, pimpin, dan sebagainya, dimana dari kata- kata tersebut dapat disimpulkan bahwa topik 1 berbicara tentang politik.

Sedangkan pada topik 2 memiliki kata-kata yang hanya berkaitan dengan islam maka topik 2 dapat disimpukan topik yang membicarakan tentang agama islam.

0 0,02 0,04 0,06 0,08 islam

umat islam agama islam manusia bela islam ahok aksi bela indonesia muslim negara nista islam indonesia pimpin nusantara ulama anak kafir masjid

2016 - Topik 1

0 0,02 0,04 0,06

quran baca quran islam ayat quran manusia sholat dunia hadits hidup iman surat malam ramadhan hafal puasa

2016 - Topik 2

Gambar 4. 2. Visualisasi tahun 2016 yang memiliki 2 topik

(33)

19 Dapat dilihat dari hasil visualisasi tahun 2016 yang memiliki 3 topik dimana topik 1 berbicara tentang agama sedangkan topik 2 dan topik 3 berbicara tentang hal diluar agama namun topik yang dibicarakan masih sama yaitu yang berkaitan dengan politik. Dari kedua visualisasi yang memiliki 2 topik dan 3 topik yang mudah untuk diinterpretasikan adalah visualisasi yang memiliki 2 topik maka pada penelitian ini akan dipilih 2 topik setiap tahunnya yang akan diinterpretasikan dan divisualisasikan menggunakan bar chart dimana sumbu-x merupakan probabilitas munculnya kata pada tahun tersebut.

4.2. Analisis Topik

Pada subbab ini akan dijelaskan mengenai topik diskusi agama Islam secara keseluruhan dari tahun 2006 – 2018 yang memiliki 421.053 tweet yang akan

0 0,05 0,1 quran

islam baca quran allah manusia ayat quran umat islam solat surat ramadhan dunia hafal malam agama hadits teman

2016 - Topik 1

0 0,05 0,1 islam

manusia umat islam aksi indonesia bela islam negara aksi bela agama nusantara anak islam…

quran muslim

negara…

kaum

2016 - Topik 2

0 0,05 0,1 islam

ahok quran agama muslim umat islam nista allah hukum nabi manusia hidup pimpin

wanita paham hadits

2016 - Topik 3

Gambar 4. 3. Visualisasi tahun 2016 yang memiliki 3 topik

(34)

20 divisualisasikan menggunakan bar chart yang dapat dilihat pada Gambar 4.4.

berikut:

Seperti pada Gambar 4.4. dapat dilihat bahwa pada tahun 2006-2018 sebagian besar pengguna twitter membagikan tweet-nya hal-hal yang menggambarkan terkait diskusi agama Islam seperti kata quran, ramadhan, masjid, sholat, dan sebagainya. Namun terdapat pula kata-kata yang tidak menggambarkan Islam seperti partai, negara, hukum dan sebagainya tetapi hanya sebagian kecil yang membicarakannya. Untuk memperkuat interpretasi pada penelitian ini juga dibantu visualisasi dengan menggunakan wordcloud dan wordlink dengan menggunakan aplikasi voyant tools [30] untuk melihat kata-kata yang dapat dijadikan ciri-ciri dari topik pada tahun 2006-2018 sehingga lebih

0 1 2 3 4

islam manusia agama islam allah quran muslim umat islam baca wanita hukum puasa anak hadits doa nabi nama jalan partai rasulullah tuhan

2006 - 2018 (Topik 2)

0 1 2 3 4

quran umat islam baca quran ayat quran malaysia negara allah dunia hidup

iman sholat Indonesia agama ramadhan pimpin masjid teman

2006 - 2018 (Topik 1)

Gambar 4. 4. Visualisasi tahun 2006-2018

(35)

21 mudah mengetahui topik apa yang banyak dibicarakan pada tahun tersebut, yang dapat dilihat pada Gambar 4.5. berikut:

Gambar 4. 5. Wordcloud dan wordlink tahun 2006-2018

4.3. Analisis Topik terhadap Waktu

Pada penelitian ini akan diamati juga untuk pembicaraan terkait diskusi agama Islam untuk setiap tahunnya untuk mengetahui topik apa yang sedang dibicarakan pada tahun-tahun tersebut dan untuk melihat probabilitas kata dari masing-masing topik. Namun pada tahun 2006 belum terdapat satu pun tweet maka visualisasi akan dimulai pada tahun 2007. Berikut visualisasi dan interpretasi untuk masing-masing tahun :

1. Visualisasi tahun 2007

0 0,002 0,004 0,006 fatah

fatah islam

2007 - Topik 2

0 0,002 0,004 0,006 fatah islam

fatah

2007 - Topik 1

Gambar 4. 6. Visualisasi tahun 2007

(36)

22 Dari Gambar 4.6. dapat dilihat kedua topik masih membicarakan hal yang sama yaitu tentang fatah dimana fatah merupakan kelompok Islam yang radikal.

Di tahun 2007 ini masih sedikit pengguna twitter yang membicarakan terkait diskusi agama Islam sehingga mengakibatkan kata pada kedua topik memiliki kesamaan. Namun untuk memperkuat interpretasi berikut wordcloud dan wordlink untuk tahun 2007.

Berikut beberapa tweet yang dibicarakan pada tahun 2007 :

2. Visualisasi tahun 2008

Tidak jauh berbeda dengan tahun 2007, di tahun 2008 pun masih sedikit tweet yang berkaitan dengan diskusi agama Islam, seperti yang terlihat pada Gambar 4.8. yang memperlihatkan 2 topik yang dibicarakan pada tahun ini.

“Ulama Islam surati Paus:

Lebih 130 ulama Islam menulis kepada Paus dan para pemimpin Kristen lainnya mende.. “

“Gelar Baru Yuni Shara:

ANGAN-angan Yuni Shara menunaikan rukun Islam kelima terwujud sudah.

Kakak kandung.. “ Gambar 4. 7. Wordcloud dan wordlink tahun 2007

(37)

23 Di tahun 2008, topik 1 dan topik 2 memiliki kata-kata yang sama yang masih merupakan kata-kata yang berkaitan dengan Islam hanya saja setiap kata pada kedua topik memiliki probabilitas kata yang berbeda. Karena masih terdapat sedikit kata yang muncul di bar chart maka pada tahun ini akan memperlihatkan kata-kata dengan wordcloud dan wordlink.

0 0,02 0,04 0,06 rumah

umat islam islam

2008 - Topik 2

0 0,05 0,1

islam rumah umat islam

2008 - Topik 1

Gambar 4. 8. Visualisasi tahun 2008

Gambar 4. 9. Wordcloud dan wordlink tahun 2008

(38)

24 Berikut beberapa tweet yang dibicarakan pada tahun 2008 berdasarkan kata-kata yang muncul pada wordcloud dan wordlink.

3. Visualisasi tahun 2009

“Serangan Israel, Hendaknya

Mempersatukan Umat Islam “

“Tersangka bom Mumbai ditahan:

Pakistan menerapkan tahanan rumah pendiri kelompok militan Islam yang diduga terka.. “

“Forum Ekonomi Dunia Islam Kelima Akan Digelar di Jakarta:

Forum Ekonomi Dunia Islam (World Islamic Economic Foru.. “

0 0,02 0,04 0,06 0,08 islam

dunia islam umat islam negara islam malaysia kuala lumpur berita presiden raja masjid jalan universitas manusia anak pimpin malam raya islam malaysia tokoh syariat iran

2009 - Topik 1

0 0,02 0,04 0,06

quran manusia islam agama islam muslim baca quran buku allah indonesia ustadz bank islam ayat quran hadits mahasiswa nama menteri sekolah ketua kaum partai terorisme

2009 - Topik 2

Gambar 4. 10. Visualisasi tahun 2009

Malaysia

Partai

(39)

25 Pada topik 1 dapat dilihat terdapat kata-kata yang berkaitan dengan Malaysia yang dimana Negara tersebut merupakan salah satu Negara Islam di dunia, di tahun 2009 pengguna twitter membicarakan terkait Negara Islam yang melibatkan Malaysia seperti berikut:

Sedangkan kata-kata pada topik 2 tidak banyak kata khusus seperti kata- kata pada topik 1 namun ada 1 kata yang menjadi ciri pada topik 2 yaitu “partai”

seperti pada tweet berikut:

“NEGARA ISLAM PANDANGAN PAS DAN UMNO:

Apakah Malaysia Sebuah Negara Islam? PAS KATA:

Malaysia bukan sebuah negara..

“Tahukah Anda: Muslim Pertama yang Menjelajahi Ruang Angkasa: Malaysia masih disebut-sebut sebagai negara Islam p..”

“Malaysia adalah negara Islam yang memiliki pusat perjudian yang legal... #fact”

“Hasyim: Fatwa Golput Belum Tentu Dongkrak Partai Islam: Ketua Umum PBNU KH Hasyim Muzadi menyatakan, keberadaan .. “

“Suara partai Islam turun : Sejumlah survey pemilu menunjukkan perolehan suara partai-partai Islam akan menurun..”

“(Kanal Pemilu) Partai Islam Tidak Pernah Dapat Dukungan Mayoritas: Guru besar Universitas Islam Negeri (UIN) Sun.. “

(40)

26 Berikut wordcloud dan wordlink untuk melihat semua kata-kata yang muncul pada tahun ini dimana terdapat 1.156 tweet:

4. Visualisasi tahun 2010

Diantara kata-kata pada topik 1 terdapat kata Kristen dimana pada tahun 2010 kata ini banyak dibicarakan pengguna twitter seperti pada tweet berikut:

Gambar 4. 11. Wordcloud dan wordlink tahun 2009

0 0,02 0,04 0,06 0,08 islam

quran agama islam baca quran fpi kristen manusia ayat quran allah muslim iman dokter hadits sholat tuhan bela

2010 - Topik 1

0 0,02 0,04 0,06 islam

quran umat islam bakar quran manusia indonesia negara islam dunia allah teman nama

puasa malam muslim hukum

ormas masjid islam indonesia gereja doa ahmadiyah

2010 - Topik 2

Gambar 4. 12. Visualisasi tahun 2010

Kristen FPI

Bakar quran

(41)

27 Selain kata Kristen terdapat kata FPI (Front Pembela Islam) yang sering dibicarakan pengguna twitter pada tahun ini, karena terdapat kasus dimana salah satu aksinya anggota FPI melakukan kekerasan pada salah satu perwakilan dari Komisi Nasional Hak Asasi Manusia, berikut salah satu tweet dari pengguna twitter terkait FPI.

Berbeda dengan topik 1, di topik 2 terdapat kata yang menarik yaitu tentang pembakaran Al-Qur’an yang terjadi di Amerika Serikat dan meninggal nya pelaku pembakaran, berikut tweet nya:

Berikut wordcloud dan wordlink untuk melihat semua kata-kata yang muncul pada tahun ini dimana terdapat 12.618 tweet:

“DEBAT ISLAM DAN KRISTEN:

KONTROVERSI YANG TERJADI ANTAR ISLAM DAN KRISTEN- YAHUDI TERJADI MENGENAI HARI SABAT. DAN ... “

“yang bikin blog menjelek- jelekkan islam itu emang gaktau diri, tapi kita juga jangan langsung nge-judge semua orang Kristen”

“klo kta pa adit,islam itu agama yg lemah lembut,menyelesaikan masalah dgn bijaksana,klo FPI kya gtu,curiga bukan islam yak?#tweetseriustudey”

“Heran pd sikap banyak sekali kalangan Muslim yg diam2 menyetujui FPI, padahal sdh jelas menodai citra Islam.

#bubarkanFPI”

“Rencana pendeta bakar Quran hanya 'ditunda':

Pendeta AS yang mengancam membakar Quran pada peringatan 9/11 menyata... “

“Naudzubillah ,pastur bob pembakar Quran meninggal dalam sebuah kecelakaan mobil fatal dengan kondisi tewas terpanggang.”

(42)

28 5. Visualisasi tahun 2011

Di tahun 2011 pada topik 1 dan topik 2 memiliki perbedaan dimana pada topik 1 terdapat kata ahmadiyah dimana pada tahun ini banyak kekerasan terhadap gerakan Islam tersebut dan banyak pengguna twitter yang membagikan pendapat

Gambar 4. 13. Wordcloud dan wordlink tahun 2010

0 0,02 0,04 0,06 0,08 islam

agama islam allah umat islam manusia muslim quran ahmadiyah iman kristen dunia nama hukum nabi tuhan jalan anak fpi sholat rasulullah malam dokter

2011 - Topik 1

0 0,02 0,04 0,06 quran

islam manusia baca quran indonesia negara islam ayat quran umat islam ramadhan teman agama islam hadits sholat wanita islam indonesia allah dokter hidup ormas

2011 - Topik 2

Gambar 4. 14. Visualisasi tahun 2011

Ahmadiyah

(43)

29 nya tentang ahmadiyah, sedangkan pada topik 2 hanya terdapat kata-kata umum terkait diskusi agama Islam. Berikut beberapa tweet berdasarkan kata-kata yang muncul pada topik 1:

Berikut wordcloud dan wordlink untuk melihat semua kata-kata yang muncul pada tahun ini dimana terdapat 31.340 tweet:

“Sekitar 700 orang dari Gerakan Reformis Islam (Garis) dan Persatuan Umat Islam (PUI) intimidasi jamaah Ahmadiyah yang bersaksi di Cibinong.”

“Keyakinan Ahmadiyah spt itu tak membuat mereka keluar dari Islam. Mereka berkeyakinan begitu krn punya ta'wil/tafsir yg berbeda.”

“Banyak jg umat Islam yg berpendapat bhw keyakinan Ahmadiyah merupakan penodaan atas Islam. Jangan2, di kepolisian jg ada yg berpikir begitu.”

Gambar 4. 15. Wordcloud dan wordlink tahun 2011

(44)

30 6. Visualisasi tahun 2012

Pada tahun 2012 banyak pengguna twitter membahas tentang film yang berkaitan dengan Islam seperti kata yang terdapat di topik 1, pembahasan film ini beragam seperti pada tweet berikut:

0 0,02 0,04 0,06 0,08 islam

agama islam umat islam quran allah muslim dunia sholat puasa nabi ramadhan doa film manusia anak jalan malam perempuan wanita

2012 - Topik 1

0 0,02 0,04 0,06

quran manusia islam allah baca quran ayat quran indonesia iman hadits teman hidup negara agama tuhan hukum muslim ilmu sunnah lelaki buku hafal zaman yahudi nikmat

2012 - Topik 2

Gambar 4. 16. Visualisasi tahun 2012

“#IndonesiaTanpaJIL gr2 film .@Hanungbramantyo yg sematkan pesan trtu,perasaan kami jd resah,ga nyaman Islam diceritakan spt itu”

“Kiamat yang digambarkan Al-Qur’an jauh lebih dahsyat dari apa yang digambarkan pada film 2012.”

“Sekilas td liat film yg diputer di antv, sekali lg islam dijadiin musuh karna teroris nya.. hadeuuhh ga bs ya hollywood bikin film biasa aja”

Film

Yahudi

(45)

31 Sedangkan pada topik 2 tidak ada kata khusus hanya ada beberapa pengguna twitter yang membicarakan tentang yahudi, seperti pada tweet berikut:

Berikut wordcloud dan wordlink untuk melihat semua kata-kata yang muncul pada tahun ini dimana terdapat 67.750 tweet:

7. Visualisasi tahun 2013

Tahun 2013 merupakan tahun yang paling banyak jumlah tweet nya dibandingkan dengan tahun-tahun sebelumnya maupun sesudahnya yaitu sebanyak 98.347 tweet. Pada topik 1 terdapat kata hukum tetapi kata tersebut masih berkaitan dengan diskusi agama Islam sedangkan pada topik 2 terdapat kata dokter dan Indonesia seperti Gambar 4.18.

“Kena mengakui ada berbagai pihak mengambil kesempatan atas isu konflik Palestin-Israel termasuk org Islam& Yahudi utk raih sokongan politik”

“Lepas dari kebencian sebagian kalangan Islam pd Yahudi, ada banyak kemiripan antara hukum Islam dan Yahudi.”

“Barang Siapa Yang Mengikuti Budaya Yahudi Maka dia Bahagaian dari Mereka (Hadits)”

Gambar 4. 17. Wordcloud dan wordlink tahun 2012

(46)

32 Namun 2 kata yang terdapat di topik 2 yakni dokter dan Indonesia tidak berkaitan seperti pada tweet-tweet berikut:

0 0,02 0,04 0,06 0,08 islam

manusia agama islam allah quran umat islam muslim hidup

lelaki sholat nabi dunia muhammad negara nama saudara rasulullah hukum iman

2013 - Topik 1

0 0,02 0,04 0,06

quran islam baca quran allah ayat quran manusia umat islam pahala malam doa ramadhan puasa wanita hafal dokter indonesia teman iman muslim anak

2013 - Topik 2

Gambar 4. 18. Visualisasi tahun 2013

“Yg salah katakan salah lalu hukum sbg pelajaran bg semua,itulh islam. yg jls salah dianggap bnr semua,itu Islam liberal”

“Ibnu Sina, ilmuwan islam yg pakar dalam ilmu kedokteran yg diakui dunia juga hafal quran sejak usia 9 tahun.”

“Belajar agama kena berguru dgn ustaz di surau masjid, bkn berguru dgn TV melalui drama. Ambil hukum dari Quran Hadis bukan dari drama TV.”

“Di negara negara barat wanita berbondong masuk islam dan berhijab serta niqab.

Tapi di indonesia wanita "islam" berlomba pamer aurat.”

Hukum

Indonesia Dokter

(47)

33 Berikut wordcloud dan wordlink untuk melihat semua kata-kata yang muncul pada tahun ini:

8. Visualisasi tahun 2014

Gambar 4. 19. Wordcloud dan wordlink tahun 2013

0 0,02 0,04 0,06 0,08 islam

quran manusia agama islam umat islam muslim dunia allah hidup nabi hadits indonesia nama rasulullah salam

2014 - Topik 1

0 0,02 0,04 0,06

quran islam allah baca quran manusia umat islam sholat ayat quran negara iman ramadhan agama partai hafal

anak saudara puasa pahala wanita pimpin hadits gaza

doa

2014 - Topik 2

Gambar 4. 20. Visualisasi tahun 2014

Indonesia

Gaza

(48)

34 Pada tahun 2014 di topik 1 terdapat kata yang menarik diantara kata-kata yang lainnya yang berkaitan dengan diskusi agama Islam yaitu kata Indonesia.

Sedangkan pada topik 2 terdapat kata gaza dimana pada tahun ini awal terjadi konflik antar Israel-palestina. Berikut beberapa tweet yang dibagikan oleh para pengguna twitter pada tahun ini:

Berikut wordcloud dan wordlink untuk melihat semua kata-kata yang muncul pada tahun ini dimana terdapat 64.389 tweet:

9. Visualisasi tahun 2015

Pada tahun 2015 muncul kata Islam nusantara pada topik 1yang dapat diliihat pada Gambar 4.22. dimana Islam nusantara adalah Islam yang mempertimbangkan budaya dan adat istiadat di Indonesia yang juga bertolak belakang dengan Islam arab.

“Hingga saat ini arrahmah & voa-islam yg intoleran dan pro-kekerasan msh mjd dua situs (tema) islam tertinggi di Indonesia. Harus dilawan.”

13 Januari 1965 Anggota PKI dan BTI menyerang anggota Pelajar Islam Indonesia yg sedang melakukan latihan di Desa Kanigoro Kediri Jawa Timur

“Dapat berita dari sahabat.Gaza kini diserang bertubi2 oleh rejim zionis.

Allahuakbar,semakin lama semakin bnyk ujian buat Islam.”

“Dengan lebaran ini umat Islam belum sepenuhnya merdeka, banyak saudara kita seperti di Gaza yang menderita. #PrayForGaza

#PrayForPalestine

Gambar 4. 21. Wordcloud dan wordlink tahun 2014

(49)

35 Pada tahun 2015 muncul kata Islam nusantara pada topik 1, dimana Islam nusantara adalah Islam yang mempertimbangkan budaya dan adat istiadat di Indonesia yang juga bertolak belakang dengan Islam arab. Berikut tweet tentang Islam nusantara:

0 0,02 0,04 0,06 0,08 islam

manusia umat islam quran agama islam

allah muslim dunia ayat quran nusantara nabi islam nusantara hidup hadits malam hukum

iman tuhan sholat

2015 - Topik 1

0 0,02 0,04 0,06

quran baca quran islam allah agama islam manusia sholat indonesia hafal muslim ramadhan negara situs

2015 - Topik 2

Gambar 4. 22. Visualisasi tahun 2015

“Islam Nusantara itu keislaman yang mengakar di Negara Indonesia. Urgensinya tampak saat muncul gerakan mendirikan khilafah, merobohkan NKRI”

“Islam Nusantara/Indonesia bkn sekte baru tapi Islam yg dimaknai secara kontekstual dan rasion oleh Muslim yg cinta Indonesia”

Islam Nusantara

Situs

(50)

36 Sedangkan pada topik 2 terdapat kata yang menarik yaitu situs dimana pada tahun ini terdapat pemblokiran situs Islam seperti pada tweet berikut:

Berikut wordcloud dan wordlink untuk melihat semua kata-kata yang muncul pada tahun ini dimana terdapat 40.680 tweet:

10. Visualisasi tahun 2016

Berbeda dengan kata-kata di topik tahun sebelumnya, di tahun 2016 ini topik 1 menarik untuk dibahas karena terdapat kata Ahok dimana Ahok merupakan Gubernur DKI Jakarta periode 2014-2017. Seperti yang bisa dilihat pada Gambar 4.24.

“seharusnya situs-situs porno yang harusnya diblokir, bukan malah situs islam !!”

ini baru pemblokiran terhadap situs islam | besoknya terhadap ceramah islam | ntar lagi sama kajian di masjid #BubarkanBNPT

pemblokiran terhadap situs-situs Islam ini semakin menunjukkan kearah mana rezim Jokowi berpihak. ayo lawan kawan2... #KembalikanMediaIslam

Gambar 4. 23. Wordcloud dan wordlink tahun 2015

Gambar

Gambar 1. 1. Jumlah penduduk Indonesia berdasarkan agama yang dianut
Gambar 2. 1. Evaluasi topic modelling
Gambar 3. 1. Jumlah tweet pertahun pada tahun 2006 hingga 2018
Gambar 3. 2. Representasi model grafis LDA
+7

Referensi

Dokumen terkait

Makcik kamu ingin belikan buku untuk kamu.Beliau meminta kamu memilih buku yang kamu suka?. Tulis mesej bersama tiga sebab mengapa kamu memilih

Data yang diukur pada penelitian ini adalah kegiatan OSEAN siswa, pemahaman konsep siswa, keterlaksanaan pembelajaran, dan ketuntasan menyelesaikan masalah

Alhamdulillah, segala puji serta syukur atas kehadirat Allah SWT atas segala limpahan rahmat dan hidayah-Nya sehingga peneliti dapat menyelesaikan skripsi dengan

Angka prevalensi menarche dini pada penelitian ini menunjukkan angka yang hampir sama dengan hasil Riset Kesehatan Dasar tahun 2010 yang menyatakan bahwa sebanyak

merupakan seperangkat hak yang melekat dalam diri manusia dalam kedudukannya sebagai anggota dari sebuah negara. Hak asasi sifatnya universal, tidak terpengaruh

dilakukan pada divisi redaksi PT.Tribun pekanbaru dapat diterima oleh karyawan.... Hal ini ditunjukkan dengan masih kurangnya kesediaan karyawan divisi redaksi

Dalam rangkaian Rancang bangun alat pengendali interval nyala lampu sebagai pemanipulasi efek gerakan dengan output berupa LED sebanyak 16 buah ini selain berfungsi sebagai penanda

Untuk menanggulangi berbagai permasalahan sebagaimana hal di atas, perlu adanya Penelitian Tindakan Kelas (PTK) dengan judul Peningkatan Hasil Belajar IPA dengan Metode