• Tidak ada hasil yang ditemukan

Literature Review Deteksi Berita Hoax Menggunakan Machine Learning

N/A
N/A
Protected

Academic year: 2022

Membagikan "Literature Review Deteksi Berita Hoax Menggunakan Machine Learning"

Copied!
6
0
0

Teks penuh

(1)

RO 16 1st Gloria Elsa Ave Cordana

Dapartemen Teknik Mesin dan Industri Universitas Gadjah Mada

Yogyakarta, Indonesia gloria.elsa.a@mail.ugm.ac.id

2nd Hilya Murdika Arini Dapartemen Teknik Mesin dan Industri

Universitas Gadjah Mada Yogyakarta, Indonesia hilya.mudrika@ugm.ac.id

3rd Yun Prihantina Mulyani Dapartemen Teknik Mesin dan Industri

Universitas Gadjah Mada Yogyakarta, Indonesia yun.prihantina@ugm.ac.id

Abstrak— Berita hoax merupakan fenomena yang sulit dihilangkan. Berita hoax dapat ditemukan dalam beragam platform seperti website dan media sosial. Jika terus dibiarkan berita hoax memberikan dampak yang buruk bagi masyarakat.

Penelitian kali ini akan memaparkan riset terkini mengenai deteksi berita hoax menggunakan machine learning dalam kurun waktu 2016-2020. Metode yang digunakan dalam penelitian ini adalah systematic literature review (SLR). Hasil dari penelitian ini yaitu metode yang digunakan untuk klasifikasi berita hoax adalah, Support Vector Machine (SVM), Naive Bayes dan Belief Rule Base (BRB). Akan tetapi jika menggunakan SVM dan Naive Bayes, tidak ada ekstraksi ilmu pengetahuan yang bisa didapatkan masyarakat. Metode BRB dapat memberikan ekstraksi ilmu pengetahuan.

Kata Kunci—Belief Rule Base, Naive Bayes, deteksi berita hoax, Support Vector Machine

I. PENDAHULUAN

Informasi merupakan salah satu kebutuhan yang penting bagi manusia. Manusia dapat mengetahui berbagai hal yang di dunia ini melalui informasi. Dunia berubah begitu cepat termasuk teknologi-teknologi yang ada. Saat ini banyak hal sudah dikemas dalam bentuk digital. Perubahan tersebut tentunya memberikan dampak bagi manusia. Tidak diragukan lagi, manusia memperoleh keuntungan dari kemajuan teknologi yaitu dapat dengan mudah dan cepat memperoleh berbagai informasi melalui internet. Manusia dapat menggunakan internet untuk memperoleh informasi dari sosial media ataupun website.

Pada tahun 2018, Indonesia menempati urutan ke enam sebagai negara pengguna internet di dunia [1]. Banyaknya jumlah pengguna internet di Indonesia dapat mempengaruhi jumlah pengguna media sosial di Indonesia. Pada tahun 2020, penduduk Indonesia yang aktif menggunakan sosial media kurang lebih 59% atau 160.000.000 orang [2].

Akan tetapi kemajuan teknologi juga dapat memberikan dampak negatif bagi manusia. Salah satu masalah dari dunia digital adalah orang dapat dengan mudah menyebarkan berita hoax. Berita hoax atau berita palsu merupakan sebuah informasi palsu yang dianggap benar dan dapat membuat persepsi manusia menjadi salah [3]. Penyebaran berita palsu biasanya memiliki dua tujuan yaitu membujuk atau memanipulasi opini publik.

Selain itu, penyebaran berita hoax biasanya disertai dengan penipuan dan ancaman [4]. Berita hoax adalah informasi tidak bersumber, sesat dan berbahaya [5].

Berita palsu dapat menyebabkan berbagai hal yaitu menciptakan rasa khawatir, kegaduhan, kesalahpahaman serta pembodohan [6]. Berita palsu tidak hanya berbahaya bagi individu dan masyarakat, tetapi juga bagi bisnis dan pemerintah.

Berita hoax di Indonesia cukup banyak bahkan cenderung meningkat dalam tiga terakhir. Pada 1 Januari - 16 November 2020 terdapat 2.024 berita hoax di Indonesia. Hal ini menunjukkan peningkatan yang cukup drastis karena pada tahun 2019, jumlah berita hoax adalah 1.221 dan pada 2018 jumlah berita hoax ada 997 [7].

Ada berbagai bentuk berita hoax yang tersebar di internet yaitu tulisan, gambar dan video. Berita palsu berupa teks merupakan jenis berita palsu yang sering dijumpai oleh masyarakat Indonesia. Dari seluruh berita hoax yang tersebar di internet, pada tahun 2017 terdapat 62,1% berita hoax dalam bentuk tulisan Berita hoax berupa teks Selain itu terdapat 37%

berita palsu dalam bentuk gambar dan0,4% video [7].

Banyaknya berita hoax yang tersebar membuat masyarakat Indonesia bingung membedakan antara berita hoax atau tidak.

Saat ini sudah banyak dilakukan penelitian terkait deteksi berita hoax. Salah satu cara untuk membuat deteksi berita hoax adalah menggunakan machine learning.

Machine learning adalah salah satu cabang dari artificial intelligent (AI) yang merupakan sebuah mesin namun bisa belajar seperti manusia [8]. Mesin dikembangkan supaya dapat belajar sendiri tanpa perlu arahan dari penggunanya. Machine learning biasanya dikembangkan berdasarkan ilmu lainnya seperti matematika, data mining dan statistika. Mesin akan belajar dari data-data yang ada sehingga dapat menganalisis jika diberi data baru.

Saat ini sudah banyak penelitian yang dilakukan untuk mendeteksi berita hoax menggunakan machine learning.

Metode klasifikasi yang digunakan untuk mendeteksi berita hoax juga bermacam-macam. Metode klasifikasi yang digunakan antara peneliti satu dengan peneliti lainnya juga dapat berbeda-beda.

Akan tetapi hasil akhir dari penelitian menggunakan machine learning hanya sebuah mesin yang dapat mendeteksi berita hoax atau bukan. Masyarakat umum membutuhkan suatu informasi yang dapat membantu mereka mengenali berita hoax dan berita asli. Tidak semua masyarakat mengerti bagaimana cara menggunakan machine learning.

Literature Review Deteksi Berita Hoax Menggunakan

Machine Learning

(2)

RO 17 Tujuan dari penelitian ini adalah menampilkan gap dari

penelitian yang telah dilakukan sebelumnya sehingga dapat menjadi gambaran untuk penelitian selanjutnya. Berdasarkan gap penelitian, peneliti dapat mengetahui bagaimana cara yang tepat untuk mendeteksi berita hoax sehingga masyarakat dapat membedakan berita hoax dan berita asli. Selain itu dapat diketahui bagaimana machine learning dapat membedakan berita hoax dan bukan.

II. METODE

Penelitian ini menggunakan metode Systematics Literature Review (SLR). SLR merupakan sebuah metode yang sangat penting bagi penelitian akademis. Pengetahuan harus mengikuti perkembangan zaman sehingga pengetahuan dapat dibangun di atas pekerjaan yang sudah ada sebelumnya [9].

SLR merupakan metode yang membantu peneliti menarik kesimpulan dengan berbagai tingkat kepastian, konsistensi dan keyakinan mengenai apa yang diketahui dan tidak diketahui [9].

Terdapat lima tahap dalam metode SLR [9] yang dapat dilihat pada Gambar 1.

Tahap pertama dalam SLR yaitu questioning formulation.

Pada tahap ini peneliti membuat atau mencari pertanyaan terkait dengan topik yang akan diteliti sehingga peneliti dapat menghasilkan review literature yang fokus. Pada penelitian kali ini peneliti ingin mendapatkan jawaban atas beberapa Research Question (RQ) yaitu:

RQ1: Klasifikasi apa saja yang dapat digunakan pada machine learning untuk mendeteksi berita hoax?

RQ2: Bagaimana machine learning dapat mendeteksi atau mengklasifikasikan berita hoax?

RQ3: Bagaimana hasil dari machine learning dalam mendeteksi berita hoax?

Tahap kedua adalah locating studies yang berguna untuk membantu peneliti dalam mencari kriteria penelitian yang relevan. Ketika peneliti telah mendapatkan kriteria yang relevan maka peneliti dapat mencari paper dengan strategi penelitian yang lebih efektif.

Pada penelitian kali ini, peneliti mencari paper dari berbagai online data base seperti Spinger, Science Direct, Taylor &

Francis dan Google Scholar. Kata kunci yang digunakan dalam pencarian ini yaitu detection hoax news, classification fake news, classification hoax news, detection fake news, fake news machine learning, predicting fake news dan outcome prediction.

Jumlah artikel yang didapat pada tahap ini adalah 39.

Tahap ketiga dari SLR yaitu Study selection and evaluation.

Pada tahap ini peneliti akan menggunakan beberapa kriteria yang digunakan untuk menilai relevansi dari setiap paper yang telah dicari. Pada tahap ini peneliti dapat menentukan apakah studi tersebut dapat benar-benar menjawab pertanyaan yang telah ditentukan. Jurnal dipilih berdasarkan online database dengan kriteria periode penerbitan 2016 sampai 2020. Untuk mendapatkan jurnal yang sesuai maka langkah pertama adalah membaca bagian judul dan abstrak. Langkah selanjutnya adalah membaca jurnal secara menyeluruh. Pada tahap ini terdapat 15 jurnal yang relevan dengan penilaian yang akan dilakukan.

Setelah studi yang relevan dengan pertanyaan tinjauan pustaka telah dikumpulkan maka tahap selanjutnya adalah Analysis and synthesis Tujuan dari analisis adalah memeriksa studi dari individu dan menyelidiki bagaimana komponen saling berhubungan satu sama lain. Sintesis adalah menempatkan temuan dari individu secara bersama-sama dengan temuan lainnya. Sehingga dapat disimpulkan bahwa pada tahap ini bertujuan untuk mengembangkan pengetahuan yang tidak tampak atau tersirat yang ada pada studi.

Tahap terakhir yaitu Reporting and using the result. Tahapan ini dilakukan dengan cara memaparkan semua studi yang telah dipilih serta menampilkan apa yang diketahui dan tidak diketahui berdasarkan pertanyaan tinjauan.

Gambar 1. Systematic Review Sumber: Dokumen pribadi

III. HASIL DAN PEMBAHASAN A. Kajian Topik Berita Hoax

Berita hoax dapat ditemukan dalam berbagai topik seperti politik, selebriti dan kesehatan. Berdasarkan Tabel I topik politik adalah topik yang paling sering diteliti karena berita hoax mengenai politik cukup banyak. Ketika suatu negara sedang terjadi momen penting terkait politik maka berita hoax mengenai politik akan meingkat [10]. Selain topik politik, berita hoax mengenai tokoh terkenal seperti selebriti cukup banyak diteliti. Banyak orang tertarik dengan kehidupan orang terkenal sehingga mereka tidak luput dari berita hoax [11].

Berbeda dengan topik politik dan selebriti, penelitian mengenai deteksi berita hoax dengan topik kesehatan masih sedikit. Meskipun begitu dampak yang ditimbulkan berita hoax mengenai topik kesehatan cukup besar karena berhubungan dengan mental dan kesehatan tubuh manusia. Berita hoax dapat mempengaruhi pembaca untuk mengeluarkan uang kepada penyebar berita hoax untuk biaya kesehatan [12].

(3)

RO 18 TABELI. TOPIK DAN PLATFORM

Peneliti Deteksi

Platform berita Fauzi dkk (2019) berita hoax politik Twitter Santoso dkk (2020) berita hoax politik Website Hussain dkk (2020) berita hoax umum Website Mustofa dan Mahfudh

(2019) berita hoax umum Website

Henry dan Stattner (2019) berita hoax selebriti Twitter Ajao dkk (2019) berita hoax selebriti Twitter Buthani dkk (2019) berita hoax politik Twitter Rahmat dkk (2019) berita hoax kesehatan Website Pratiwi dkk (2019) berita hoax kesehatan Website Tanjung (2018) berita hoax kesehatan Twitter

Kong dkk (2016) trauma

Hossain dkk (2017) TBC

Hossain dkk (2018) gempa bumi

Islam dkk (2020) banjir

Biswas (2019) kanker

B. Kajian Platform Berita Hoax

Selain menyebar dengan berbagai topik, berita hoax menyebar melalui berbagai platform seperti situs web dan media sosial. Bahkan media sosial pun memiliki berbagai macam jenis. Pada tahun 2020, total pengguna media sosial di Indonesia adalah 160 juta atau 59% dari total penduduk Indonesia. Lima media sosial yang paling banyak digunakan di Indonesia, yaitu Youtube, WhatsApp, Facebook, Instagram dan Twitter [13]. Menurut Mastel dalam [14] prosentase situs web menyebarkan berita hoax adalah 34,90%, aplikasi chatting sebesar 62,80% dan media sosial sebesar 92,40%.

Berdasarkan Tabel 1, banyak yang melakukan menelitian berita hoax di Twitter dan situs web. Twitter merupakan platform yang mudah digunakan untuk membuat dan menyebarkan berita hoax serta opini seseorang karena memiliki fitur hashtagging, yang berfungsi sebagai kata kunci untuk pencarian suatu informasi [12]. Website merupakan media populer untuk mempublikasikan berita baik itu berita palsu atau berita asli [4].

C. Kajian Metode Klasifikasi Berita Hoax

Saat ini sudah banyak penelitian dilakukan menggunakan machine learning terutama dalam klasifikasi atau memprediksi berita hoax. Ada berbagai klasifikasi yang dapat digunakan untuk mendeteksi berita hoax seperti Support Vector Machine (SVM), K-Nearest Neighbor (KNN), Naive Bayes, Random Forest dan sebagainya.

Metode klasifikasi berita hoax yang sering digunakan pada penelitian sebelumnya adalah Naive Bayes dan SVM. Naive Bayes adalah metode klasifikasi berdasarkan probabilitas dan Teorema Bayesian [15]. Setiap metode pasti memiliki kekurangan dan kelebihan. Menurut Ridwan dalam [16] Naive

Bayes memiliki kelebihan yaitu data yang dibutuhkan untuk data training tidak banyak dan mudah diimplementasikan.

Meskipun begitu Naive Bayes memiliki kekurangan yaitu tidak ada keterkaitan antar fitur. Dalam realitinya, fitur-fitur tersebut dapat memiliki keterkaitan sehingga keterkaitan-keterkaitan tersebut tidak dapat dikodekan di dalam Naive Bayes [ 16].

SVM. merupakan sebuah sistem pembelajaran yang menggunakan ruang hipotesis berupa fungsi-fungsi linear dalam sebuah ruang fitur yang berdimensi tinggi, dilatih dengan algoritma pembelajaran yang didasarkan pada teori optimasi dan mengimplementasikan learning bias yang berasal dari teori pembelajaran statistik [17].

Kelebihan dari metode klasifikasi SVM yaitu bersifat fleksibel karena dapat diimplementasikan pada data yang bersifat linear atau non-linear. Selain itu SVM juga memiliki keunggulan lain yaitu solusi yang dihasilkan optimal karena masalah optimalitas memiliki sifat konveks. SVM tidak akan memiliki beberapa solusi dengan minimum lokal. Kelebihan lainnya yaitu klasifikasi Kernel SVM yang sesuai seperti Kernel Gaussian dapat menekankan pada kesamaan antara data yang dibandingkan. Misalnya ketika ingin membandingkan struktur keuangan perusahaan, semakin mirip struktur keuangan suatu perusahaan maka nilai Kernel semakin tinggi [16]. SVM memang memiliki cukup banyak kelebihan, namun metode klasifikasi ini juga memiliki kekurangan yaitu hasil SVM kurang transparan [16].

Diantara kedua metode klasifikasi ini, metode yang paling sering digunakan adalah Naive Bayes karena lebih cepat dan mudah diimplementasikan [15]. Dalam penelitian deteksi berita hoax di Bangladesh [15] SVM dan Naive Bayes digunakan untuk membuat model klasifikasi tersebut. Kedua metode tersebut lalu dibandingkan tingkat presisi, recall dan f1-score.

Dari penelitian tersebut diperoleh hasil bahwa SVM memiliki rata-rata presisi, recall dan f1-score paling tinggi.

D. Kajian Proses Klasifikasi

Melakukan deteksi berita hoax dengan menggunakan bantuan machine learning merupakan hal yang sudah sering dilakukan. Akan tetapi mesin tidak dapat langsung membedakan berita hoax, harus melatih mesin atau membuat model klasifikasi terlebih dahulu. Untuk membuat model klasifikasi maka diperlukan data. Data yang digunakan untuk membangun sebuah model disebut data training. Jumlah data yang dialokasikan untuk membangun model sebanyak 70% dan sisanya untuk menguji performansi dari model klasifikasi yang telah dibuat [15]. Mesin akan mempelajari data training yang telah diberikan sehingga ketika mesin diberikan data testing maka mesin sudah dapat mengelompokkan berita hoax atau bukan.

Data berita hoax bisa didapatkan crawling berita di situs web atau media sosial. Akan tetapi data yang diperoleh tersebut tidak dapat langsung digunakan. Data masih perlu melalui tahap preprocessing. Preprocessing adalah tahap melakukan beberapa perubahan pada data [5]. Preprocessing memiliki beberapa tahapan seperti yang terlihat pada Gambar 2.

(4)

RO 19 Gambar 2. Tahap Preprocessing

Sumber: Dokumen Pribadi

Tahap pertama yaitu case folding yang mengubah huruf kapital menjadi huruf kecil [10]. Hal ini dilakukan karena mesin mendeteksi huruf kecil dan huruf besar sebagai sesuatu yang berbeda. Tahap kedua yaitu filtering. Filtering merupakan tahap untuk menghilangkan emoji dan link pada teks berita yang telah diambil. Hal tersebut dilakukan karena link dan emoji tidak akan diproses saat membuat model.

Tahap ketiga yaitu tokenisasi. Tokenisasi merupakan tahap untuk memisahkan kata-kata yang ada di kalimat serta menghilangkan seluruh tanda baca [5]. Tahapan ke empat yaitu menghilangkan stopword. Menghilangkan stop word yaitu proses menghilangkan kata depan yang terdapat dalam suatu kalimat seperti di, ke dan dari [18].

Tahap ke lima yaitu stemming. Stemming merupakan proses menghilangkan awalan dan akhiran pada kata sehingga kata yang diperoleh adalah kata dasar [5]. Awalan yang dihilangkan yaitu be-, di-, ke-, me- dan se-. Akhiran yang dihilangkan yaitu -i, -an dan -kan.

Setelah data sudah siap untuk diproses maka tahap selanjutnya adalah ekstraksi fitur syntax. Fitur ini digunakan untuk melihat sentimen dan struktur bahasa yang ada pada berita hoax dan berita asli sehingga nantinya dapat digunakan sebagai acuan untuk mengklasifikasikan berita. Pembobotan kata adalah perhitungan kata pada jumlah kemunculan masing-masing token dalam dokumen [5]. Jika sudah dilakukan ekstraksi fitur maka model klasifikasi bisa dibuat.

E. Kajian Hasil Klasifikasi

Hasil akhir dari penelitian deteksi berita hoax menggunakan machine learning adalah sebuah model yang mampu mendeteksi mana berita hoax dan berita asli. Untuk melihat apakah model yang dibuat sudah berjalan dengan baik maka perlu di uji.

Pertama, uji yang perlu dilakukan adalah akurasi. Akurasi adalah persentase data tes yang diklasifikasikan secara benar oleh model yang telah dibuat dengan menggunakan model dari data training [19]

Uji kedua yaitu presisi. Uji presisi berfungsi untuk mengukur tingkat ketepatan antara informasi yang diminta dengan jawaban yang diberikan oleh model yang telah dibuat [20]. Uji ketiga menggunakan kurva ROC (Receiver Operating Characteristic).

Kurva ROC merupakan grafik dua dimensi dengan false positives sebagai garis horisontal dan true positive sebagai garis vertikal [21]. ROC memiliki nilai diagnosa yaitu

a. Akurasi bernilai 0,9 - 1 maka excellent classification b. Akurasi bernilai 0,8 - 0,9 maka good classification c. Akurasi bernilai 0,7 – 0,8 maka fair classification d. Akurasi bernilai 0,6 – 0,7 maka poor classification e. Akurasi bernilai 0,5 – 0,6 maka failure.

Uji ke empat adalah kurva PR (Precision-Recall). Precision- Recall adalah ukuran keberhasilan prediksi saat kelas tidak seimbang. Precision merupakan relevansi hasil, sedangkan Recall adalah ukuran berapa banyak hasil yang dikembalikan benar-benar relevan. Kurva PR menujukkan tradeoff antara presisi dan recall untuk berbagai ambang batas. Area tinggi di bawah kurva menunjukkan recall dan precision tingi [22].

TABELII. METODE DAN EKSTRAKSI KNOWLEDGE

Peneliti Metode klasifikasi

Ekstraksi knowledge

Fauzi dkk (2019) SVM tidak ada

Santoso dkk (2020) Naive Bayes tidak ada Hussain dkk (2020)

Naive Bayes dan

SVM tidak ada

Mustofa dan Mahfudh

(2019) Naive Bayes tidak ada

Henry dan Stattner (2019) SVM tidak ada

Ajao dkk (2019) SVM tidak ada

Buthani dkk (2019) Naive Bayes tidak ada

Rahmat dkk (2019) SVM tidak ada

Pratiwi dkk (2019) Naive Bayes tidak ada

Tanjung (2018) Naive Bayes tidak ada

Kong dkk (2016) belief rule base ada Hossain dkk (2017) belief rule base ada Hossain dkk (2018) belief rule base ada Islam dkk (2020) belief rule base ada

Biswas (2019) belief rule base ada

Berdasarkan Tabel II, jika dilihat output dari penelitian deteksi berita hoax yang ada masih belum dapat memberikan ekstraksi ilmu pengetahuan kepada masyarakat. Hasil akhir berupa model klasifikasi, sedangkan banyak masyarakat yang belum tentu bisa membuat model dan menggunakannya.

Masyarakat cenderung tidak mendapatkan ilmu yang berguna untuk membedakan mana berita hoax atau bukan.

Jika dilihat dari Tabel II, terdapat penelitian yang bisa memberikan ekstraksi pengetahuan kepada masyarakat yaitu menggunakan model klasifikasi Belief Rule Based (BRB). BRB

(5)

RO 20 adalah sebuah metode klasifikasi yang menggunakan peraturan

IF-THEN. Metode ini membandingkan kejadian yang menyebabkan kejadian selanjutnya dengan konsekuensi [23].

Peraturan tersebut dapat dibuat berdasarkan data kejadian aktual atau berdasarkan expert system.

Metode BRB dapat digunakan untuk memprediksi berbagai fenomena alam seperti gempa bumi [24] dan banjir [23]. Selain itu, BRB juga dapat digunakan untuk memprediksi suatu penyakit misalnya TBC [25], trauma [26] dan kanker [27].

Metode BRB sudah terbukti mampu memprediksi berbagai hal.

Hasil akhir dari penelitian yang menggunakan metode klasifikasi BRB adalah aturan-aturan yang dapat mengklasifikasikan suatu hal. Sehingga dengan menggunakan metode klasifikasi ini, dapat dilakukan ekstraksi ilmu pengetahuan kepada masyarakat umum.

F. Rekomendasi Peluang Penelitian

Peluang penelitian dalam deteksi berita hoax cukup banyak.

Topik berita hoax cukup beragam seperti politik [28], selebiri [29] dan kesehatan [30]. Akan tetapi topik yang masih sedikit dilakukan penelitian adalah berita hoax dengan topik kesehatan.

Kesehatan adalah salah satu bidang memiliki banyak berita hoax. Berita hoax dalam bidang kesehatan dapat membahayakan masyarakat [30]. Dalam jangka panjang, berita hoax juga di bidang kesehatan dapat mengubah kebiasaan seseorang dari yang awalnya benar menjadi salah sehingga justru berpotensi untuk merusak kesehatan mereka. Oleh sebab itu penelitian ini memberikan rekomendasi peluang penelitian berita hoax dengan topik kesehatan. Berita hoax terkait kesehatan cukup banyak dan dapat membuat masyarakat bahaya maka perlu diperbanyak penelitian terkait berita hoax dengan topik kesehatan.

Dari sisi platform penyebaran hoax, berita hoax dapat menyebar melalui berbagai platform seperti situs web dan media sosial seperti Twitter, Facebook dan WhatsApp. Berdasarkan kajian platform yang telah dilakukan, peneliti terdahulu hanya melakukan penelitian pada Twitter dan situs web. Masih banyak platform yang dapat dieksplorasi terutama bagian media sosial.

Terdapat peluang penelitian mengenai deteksi berita hoax di platform Facebook dan sebagainya. Selain itu terdapat peluang penelitian terhadap seluruh platform, jadi berita yang diteliti berasal dari website dan media sosial.

Dari sisi metode klasifikasi dan hasil klasifikasi berita hoax, terdapat peluang untuk menggunakan metode BRB. Sampai saat ini belum ada penelitian yang menggunakan metode BRB untuk mendeteksi berita hoax. Metode BRB justru mampu memberikan ekstraksi pengetahuan kepada masyarakat dalam bentuk rules yang dapat digunakan untuk membedakan berita hoax dan berita asli. Rules dapat berupa kelompok kata yang dapat mengidentifikasi berita hoax atau bukan

IV. KESIMPULAN

Deteksi berita hoax dapat dilakukan dengan menggunakan machine learning. Metode yang dapat digunakan yaitu Naive Bayes, SVM dan BRB. Akan tetapi metode klasifikasi Naive Bayes dan SVM tidak dapat memberikan ekstraksi ilmu pengetahuan kepada masyarakat. Metode BRB dapat memberikan ekstraksi ilmu pengetahuan.

Berita hoax dapat dideteksi menggunakan machine learning karena mesin dilatih dengan data-data yang ada. Mesin akan mempelajari data-data tersebut sehingga jika diberi data baru dapat mengklasifikasikan data tersebut ke dalam berita hoax atau bukan.

DAFTAR PUSTAKA

[1] Kominfo, “Pengguna Internet Indonesia Nomor Enam Dunia”, https://kominfo.go.id/content/detail/4286/pengguna-internet-indonesia- nomor-enam-

dunia/0/sorotan_media#:~:text=Di%20atas%20Indonesia%2C%20untuk

%20saat,Amerika%20Serikat%20sebesar%20252%20juta. , 2018, Diakses pada 20 Juni 2021.

[2] A.D. Riyato., Hootsuite (We are Social): Indonesian Digital Report 2020, https://andi.link/hootsuite-we-are-social-indonesian-digital-report-2020/

diakses pada 18 Juni 2021

[3] B. Prasetijo., “Hoax Detection System on Indonesian News Sites Based on Text Classification using SVM and SGD,” 4th Int. Conf. on Inform.

Technology, Comp, and Elect. Enginee., pp. 45-49, 2017.

[4] H. A Santoso, E.H. Rachmawanto, A.Nugraha, A.ANugroho, D.R.I.M Setiadi, dan R.S. Basuki, “Hoax classification and sentiment analysis of Indonesian news using Naive Bayes optimization”, Telkomnika (Telecommunication Computing Electronics and Control), Vol.18, No.2, pp. 799-806, 2020.

[5] H Mustofa dan A.A. Mahfudh, “Klasifikasi Berita Hoax Dengan Menggunakan Metode Naive Bayes”, Walisongo Journal of Information Technology, Vo1.1, No. 1, pp. 1-12,2019.

[6] N.F.Putri, E.Vionia dan T. Michael, “Pentingnya Kesadaran Hukum Dan Peran Masyarakat Indonesia Dalam Menghadapi Penyebaran Berita Hoax Covid-19”, Media Keadilan: Jurnal Ilmu Hukum, Vol.11, No.1, pp. 98- 111, 2020

[7] Kompas, Update 10 Negara dengan Kasus Corona Tertinggi di Asia,

Indonesia Peringkat Berapa?., 2020,

https://www.kompas.com/tren/read/2020/09/14/203100565/update-10- negara-dengan-kasus-corona-tertinggi-di-asia- indonesia- peringkat?page=all diakses pada 10 Oktober 2020

[8] El Naqa I., M.J Murphy. “What Is Machine Learning?”.Machine Learning in Radiation Oncology. Springer, Cham, 2015.

[9] R. B. Briner and D. Denyer, "Systematic Review and Evidence Systhesis as a Practice and Sholarship Tool," in Oxford Handbook of EvidenceBased Management: Companies, Classrooms and Research, Oxford University Press, 2012, pp. 112-129.

[10] A.Fauzi., E.B. Setiawan dan Z. K. A Baizal., “Hoax News Detection on Twitter using Term Frequency Inverse Document Frequency and Support Vector Machine Method”, Journal of Physics: Conference Series, Vol.

1192, No.1, , 2019

[11] O.Ajao, D. Bhowmik dan S. Zargari, “Sentiment Aware Fake News Detection On Onlide Social Network”, IEEE, pp. 2507–2511,2019.

[12] B.S. Tanjung, “Pendekatan Text Mining sebagai Sistem Pendeteksi Pemberitaan Palsu yang Tersebar dalam Twitter”, Universitas Widya Kartika, Vol.6, 2018.

[13] Databoks, “10 Media Sosial yang Paling Sering Digunakan di Indonesia”, 2020 . https://databoks.katadata.co.id/datapublish/2020/02/26/10-media- sosial-yangpaling-sering-digunakan-di-indonesia diakses pada 11 Oktober 2020.

[14] P, Wulandari, Sahermiko dan D. Utami, “ Dampak Berita Hoax Di Media Sosial Dalam Mempengaruhi Opini Mahasiswa Pada Saat Pemilihan Presiden Dan Wakil Presiden Republik”, ASPIRASI-Jurnal Ilmu Politik, Vol.4, pp. 1-19, 2019.

[15] M.G Hussain, M.R Hasan, M. Rahman, J.Protim dan S.A Hasan.,

“Detection of Bangla Fake News using MNB and SVM Classifier”, arXiv:2005.14627, 2020.

[16] L. Auria dan R.A Moro, “Support Vector Machines (SVM) as a Technique for Solvency Analysis”, SSRN Electronic Journal, doi:

10.2139/ssrn.1424949, 2011.

[17] N. Cristianini, dan J.S Tyalor,” Support Vector Machiness”, United Kingdom: Cambridge University Press., 2014.

(6)

RO 21 [18] M.A. Rahmat, Indrabayu dan I.S. Areni, “Hoax Web Detection For News

In Bahasa Using Support Vector Machine”, 2019 International Conference on Information and Communications Technology, ICOIACT 2019, pp. 332–336, 2019.

[19] M. Awad dan R. Khanna, “Efficient Learning Machines: Theories, Concepts, and Applications for Engineers and System Designers”. doi:

10.1007/978-1-4302-5990-9, 2015.

[20] H. Kurniawan, “Deteksi Twitter Bot Menggunakan Klasifikasi Decision Tree”, Jurnal Sustainable : Jurnal Hasil Penelitian dan Industri Terapan, Vol. 9, No. 1, pp. 31-37, 2020.

[21] Andriani, “Sistem Pendukung Keputusan Berbasis Decision Tree Dalam Pemberian Beasiswa Studi Kasus : Amik “ BSI Yogyakarta ”’, Seminar Nasional Teknologi Informasi dan Komunikasi 2013 (SENTIKA 2013)., 2013.

[22] Scikit Learn, Precision-Recal, 2020.

https://scikitlearn.org/stable/auto_examples/model_selection/plot_precisi on_recall.html diakses pada 11 Januari 2021.

[23] R.UI. Islam, M.S. Hossain dan K. Andersson, “Inference and Multi-level Learning in a Belief Rule-Based Expert System to Predict Flooding”, IEEE, 2020.

[24] M.S. Hossain, A.A.Hasan, S.Guha dan KA, “A Belief Rule Based Expert System to Predict Earthquake under Uncertainty”, Journal of Wireless Mobile Networks, Ubiquitous Computing, and Dependable Applications, 2018.

[25] M.S Hossain., F. Ahmed, F.T. Johora dan K. Andersson. “A Belief Rule Based Expert System to Assess Tuberculosis under Uncertainty”, J Med Syst, Vol 41, No. 43 2017.

[26] G. Kong, D.L. Xu, J.B Yang, X. Yin, T. Wang, B. Jiang dan Y. Hu, “Belief rule-based inference for predicting trauma outcome”, Knowledge-Based Systems, Vol.95, 2016.

[27] M. Biswas, S. Uddin Chowdhury, N. Nahar, M. S. Hossain and K.

Andersson, "A Belief Rule Base Expert System for staging Non-Small Cell Lung Cancer under Uncertainty," 2019 IEEE International Conference on Biomedical Engineering, Computer and Information Technology for Health (BECITHCON), 2019.

[28] Bhutani, N. Rastoggi, P. Sehgal. dan A.Purwar, “Fake News Detection Using Sentiment Analysis, 12th International Conference on Contemporary Computing”, IC3 2019, 2019.

[29] Henry. dan E Stattner, “Predictive Models For Early Detection Of Hoax Spread In Twitter, IEEE International Conference On Data Mining Workshops”, ICDMW, 2019

[30] I.Y. Pratiwi, R.A. Asmara dan F, Rahutomo, “Study of Hoax News Detection Using Naive Bayes Classifier in Indonesian Language”, Internasional Conferenve on Information & Communication Technology and System (ICTS), pp. 73–78, 2017.

Referensi

Dokumen terkait

Dari 2 metode algoritma yang digunakan pada tahap klasifikasi yaitu Naïve Bayes dan Support Vector Machine (SVM) didapatkan hasil bahwa nilai akurasi yang lebih

Penelitian ini menggunakan enam metode untuk klasifikasi yaitu Lexicon-based classifier, Naïve Bayes, Bayesian Network, SVM (Support Vector Machine), C4.5 (Decision

Prinsip kerja percobaan ini yaitu merangkai rangkaian kombina- sional dan komparator dari gerbang logika dasar dengan menggunakan IC 7408, IC 7432, dan IC 7485 dengan keluaran

Lalu rumuskan dan ajukan beberapa pertanyaan tentang hal-hal yang belum kalian ketahui dari hasil pengamatan tersebut Lakukan meditasi dengan posisi seperti pada gambar.

(1) Jika rujukan terkutip dalam teks TA terdiri atas penulis tunggal, maka yang ditulis dalam Daftar Pustaka adalah nama keluarga penulis, yang ditulis di depan dan diakhiri

Setelah itu analisis berupa klasifikasi data akan dilakukan yang pertama menggunakan metode Support vector Machine (SVM), dengan karnel yang digunakan adalah

Analisis Algoritma Support Vector Machine dan Naive Bayes Kernel dalam Klasifikasi Data (Simangunsong, 2019) permasalahan dari penelitian ini adalah setiap data

Penelitian ini menggunakan metode Support Vector Machine dan metode Support Vector Machine berbasis Particle Swarm Optimization dalam mendapatkan aturan