• Tidak ada hasil yang ditemukan

View of PENERAPAN DATA MINING UNTUK KLASIFIKASI BERITA HOAX MENGGUNAKAN ALGORITMA NAIVE BAYES

N/A
N/A
Protected

Academic year: 2024

Membagikan "View of PENERAPAN DATA MINING UNTUK KLASIFIKASI BERITA HOAX MENGGUNAKAN ALGORITMA NAIVE BAYES"

Copied!
9
0
0

Teks penuh

(1)

Copyright: ©2023 by authors. https://jurnal.murnisadar.ac.id/index.php/Tekinkom/

454

PENERAPAN DATA MINING UNTUK KLASIFIKASI BERITA HOAX MENGGUNAKAN ALGORITMA NAIVE BAYES

Saut Parsaoran Tamba1), Agusteti Laia2), Yudika Kristian Butar Butar3), Anita4)

1-4Fakultas Sains dan Teknologi, Universitas Prima Indonesia email: sautparsaorantamba@unprimdn.ac.id, agustetilaia@gmail.com,

yudikakristian@gmail.com, anitayakub_pilchan@yahoo.com

Abstract

The research aims to develop a classification model that is effective in identifying hoax news. The rapid development of information technology has had a significant impact on the dissemination of information, especially in the context of the spread of hoaxes via the internet. Hoaxes, or fake news, can cause misperceptions and negative impacts on various aspects of people's lives. To classify hoax news, this research was carried out using the Naive Bayes algorithm. The data used comes from various sources and involves stages of data collection, data analysis, and preprocessing processes. Modeling uses the Naive Bayes Algorithm, which applies the law of probability, to calculate the confidence or probability that a news item falls into the fraud category. The data preprocessing process includes tokenization, case transformation, stopwords filter, and tokens filter (by length), which aims to improve the quality of the analyzed data. Model evaluation was carried out using cross-validation, confusion matrix, and classification report methods. The evaluation results show that the model accuracy is 73.91%, with a deviation of 1.04%. The results of this research can be used to classify hoax news properly. This model can be used as an initial reference in developing more complex prediction models.

Keywords: Classification, Hoax News, Naive Bayes, Accuracy, Evaluation.

1. PENDAHULUAN

Perkembangan teknologi informasi dan internet yang terus berkembang saat ini [1]–[7]

telah membawa dampak signifikan pada berbagai aspek kehidupan manusia [1]–[9].

Perkembangan teknologi informasi yang begitu cepat memicu penyebaran informasi hoax melalui internet menjadi tidak terkontrol [10].

Kecepatan beredarnya berita seiring dengan kemajuan teknologi [11]. Penyebarannya begitu cepat karena berita palsu yang tersebar luas sangat sulit untuk ditangani di dunia digital saat ini, dimana ada ribuan platform berbagi informasi yang dapat digunakan untuk menyebarkan berita palsu atau misinformasi [12].

Kata “hoax merupakan informasi yang secara sengaja untuk menutupi informasi sebenarnya [13]. Hoax merupakan berita palsu yang kini masih tersebar melalui media sosial [14] melalui hoax tersebut masyarakat mudah terkecoh dengan pemberitaan, sehingga kesalahan persepsi dalam memahami berita

menjadi sangat tinggi. Media sosial merupakan kategori wacana online tempat orang membuat konten dan membagikannya [15]. Berita hoaks (bohong) di internet telah menjadi masalah global yang menimbulkan gejolak di masyarakat.

Kehadirannya dapat mengganggu ketertiban demokrasi, stabilitas kehidupan sosial, budaya, politik, dan ekonomi [16]. Hoax adalah informasi atau berita yang mengandung hal-hal yang belum teridentifikasi atau bukan fakta yang sebenarnya terjadi [17]. Hoax adalah berita bohong yang disengaja, yang menghasut, yang tidak akurat [18].

Beberapa penelitian sebelumnya yang telah dilakukan adalah Penerapan Algoritma Naive Bayes dan Particle Swarm Optimization untuk Klasifikasi Berita hoax pada Media Sosial[19], Klasifikasi berita hoax menggunakan Algoritma Naïve Bayes berbasis Piso [20], Analisis Data Mining Klasifikasi Berita Hoax COVID 19 menggunakan Algoritma Naive Bayes [21] dan masih banyak lagi penelitian sebelumnya yang telah dilakukan. Berdasarkan uraian di atas,

(2)

Copyright: ©2023 by authors. https://jurnal.murnisadar.ac.id/index.php/Tekinkom/

455

peneliti mencoba menerapkan data mining menggunakan Algoritma Naïve bayes untuk mengklasifikasikan berita hoax yang secara spesifik menganalisa berita tersebut.

Data mining adalah proses menemukan hubungan dalam data yang tidak diketahui oleh pengguna dan menyajikannya dengan cara yang dapat dipahami sehingga hubungan tersebut dapat menjadi dasar pengambilan keputusan [22].

Klasifikasi hoax adalah metode yang digunakan untuk membedakan berita benar (fakta) dan berita palsu (hoax). Salah satu metode klasifikasi yang dapat digunakan adalah Algoritma Naïve Bayes. Algoritma Naive bayes merupakan algoritma yang menerapkan hukum probabilitas dengan cara dari setiap kemungkinan dicari peluang terbesarnya pada penggolongan pada tingkat keseringan klasifikasi data train [23].

Algoritma tersebut dapat memprediksi pengidentifikasi kelas berita atau informasi berdasarkan prinsip probabilitas. Dalam konteks klasifikasi hoax, Naïve Bayes digunakan untuk menghitung kepercayaan atau probabilitas bahwa berita atau informasi itu termasuk dalam kategori penipuan atau bukan.

Oleh karena itu, dirancang penggunaan algoritma Naive Bayes dalam klasifikasi hoax yang dapat mengklasifikasi berita yang dapat membantu mengurangi kerugian yang mungkin terjadi akibat penyebaran informasi yang salah atau penipuan.

2. METODOLOGI PENELITIAN 2.1 Tahapan Penelitian

Penelitian ini dilakukan dengan mengikuti serangkaian tahapan sistematis untuk memecahkan masalah yang ada. Metode yang dipilih dalam penelitian ini didasarkan pada kesesuaian data dengan metode pengklasifikasi data Menggunakan Algoritma Naive Bayes. Pada gambar 1 disajikan langkah- langkah yang akan dilakukan dalam penelitian yaitu dimulai dari pengumpulan data sampai selesai.

2.2 Pengumpulan Data

Pengumpulan data penting untuk memperoleh informasi yang diperlukan dalam penelitian dan menganalisis fenomena yang

diteliti. Tahapan ini memastikan bahwa data yang diperoleh valid, terpercaya, dan mencakup berbagai aspek yang relevan dengan topik penelitian.

Sumber data yang digunakan merupakan hasil dari pengumpulan data melalui web https://www.kaggle.com/code/muhammadghazi muharam/machine-learning-for-hoax-text- classification/notebook yang mana data sebanyak 4231 data, terdiri dari 6 atribut yaitu ID, Tanggal, Judul, Narasi, Nama File Gambar.Pengumpulan data merupakan proses mengumpulkan informasi dan fakta yang relevan untuk digunakan dalam penelitian atau analisis. Proses ini melibatkan mencari, mengumpulkan, dan merekam data dari berbagai sumber, seperti survei, observasi, wawancara, dokumen, atau basis data elektronik

Gambar 1. Alur Metode Penelitian .

2.3 Analisis Data

Analisis data ialah upaya atau cara untuk mengolah data menjadi informasi sehingga karakteristik data tersebut bisa dipahami dan bermanfaat untuk solusi permasalahan, terutama masalah yang berkaitan dengan penelitian. Atau definisi lain dari analisis lain dari analisis data yakni kegiatan yang dilakukan untuk mengubah data hasil dari penelitian menjadi informasi yang nantinya bisa dipergunakan dalam mengambil kesimpulan [24].

2.4 Preprocessing

Preprocessing merupakan proses olah data mentah sebelum ke proses lainnya, dengan cara

(3)

Copyright: ©2023 by authors. https://jurnal.murnisadar.ac.id/index.php/Tekinkom/

456

eliminasi data yang tidak sesuai atau mengubah data menjadi bentuk yang lebih muda diproses oleh sistem [25]. Prepocessing juga bisa dimanfaatkan untuk mengubah data yang tidak terstruktur menjadi tersruktur [26] Data preprocessing merupakan teknik yang diterapkan pada database untuk menghapus noise, missing value, error, data yang tidak penting dan data yang tidak konsisten. Tujuan dari data preprocessing yaitu untuk mentranformasikan data mentah untuk dianalisis agar dapat menghasilkan data yang berkualitas dan akurat. Biasanya dalam data realtime database seringkali tidak lengkap dan tidak konsisten sehingga hasil data mining tidak berkualitas dan kurang akurat. Oleh karena itu, untuk meningkatkan kualitas data yang akan dianalisis perlu dilakukan langkah- langkah preprocessing data [27].

Preprocessing akan dilakukan dalam penelitian ini diantaranya :

1. Proses tokenisasi data teks adalah menyelesaikan rangkaian kalimat Saat dibutuhkan, mereka dibagi menjadi potongan-potongan karakter atau kata- kata, sering disebut token, untuk menjadi kata-kata yang memiliki arti khusus.

2. Transform Case adalah mengonversi semua karakter huruf besar dalam data menjadi huruf kecil atau sebaliknya. Hal ini dilakukan sedemikian rupa sehingga memasuki tahap model klasifikasi, huruf- hurufnya sudah seragam agar tidak terjadi kesalahan dalam proses tokenize.

3. Filter Stopwords adalah proses menghilangkan kata-kata yang tidak memiliki arti biasanya terdapat kata sambung, kata keterangan, dan lain-lain.

4. Filter Tokens (By Length) adalah menghapus kata-kata dengan panjang huruf yang ditentukan. Misalnya minimal 2 karakter dan hingga 25 karakter.

2.5 Pemodelan

Pemodelan dalam konteks penelitian atau analisis data merujuk pada proses membangun representasi matematis atau statistik dari suatu fenomena atau sistem yang sedang dipelajari.

Tujuan dari pemodelan adalah untuk memahami, menjelaskan, meramalkan, atau membuat prediksi tentang perilaku atau

karakteristik dari fenomena atau sistem tersebut.

Pemodelan yang dilakukan dalam penelitian ini diantaranya :

2.6 Klasifikasi menggunakan naïve bayes Naive Bayes adalah klasifikasi paling sederhana dan paling umum digunakan. Naive Bayes menghitung probabilitas kelas berdasarkan distribusi kata dalam dokumen. NaiveBayes memiliki beberapa keunggulan, seperti kesederhanaan, kecepatan dan keakuratan.

Namun, klasifikasi ini memiliki batasan penting dan tidak selalu memenuhi hipotesis independensi antar atribut. Dan hal ini berpengaruh pada tingkat akurasi klasifikasi [28].

2.7 Evaluasi

Evaluasi adalah proses penilaian atau pengukuran kualitas, kinerja, atau efektivitas suatu sistem, model, atau proses. Dalam konteks pembelajaran mesin dan pemodelan statistik, evaluasi digunakan untuk mengukur sejauh mana model atau algoritma dapat melakukan tugas yang diminta. Evaluasi yang dilakukan dalam peneltian ini diantaranya.

1. cross-validation dengan proses membagi dataset menjadi beberapa fold atau bagian yang sama ukurannya. Model diperlajari pada bagian data latih (training set) dan diuji pada bagian data uji (validation set).

Metrik evaluasi seperti akurasi, presisi, recall, F1-score, dll., dihitung berdasarkan hasil prediksi pada data uji.

2. Confusion Matrix memberikan informasi yang dapat digunakan untuk peringkasan kinerja klasifikasi untuk beberapa data uji dengan visualisasi.

3. Classification report merupakan visualisasi untuk mengukur kualitas performa prediksi dari algoritma klasifikasi dengan menampilkan precision, recall, f1-score, support dan accuracy [29].

3. HASIL DAN PEMBAHASAN 3.1 Proses Analisis Data

Dalam penelitian ini, digunakan data dengan dua label, yaitu label 0 dan 1. Label 0 mengindikasikan bahwa berita tersebut merupakan fakta atau bukan hoax, sedangkan label 1 mengindikasikan bahwa berita tersebut bukan fakta atau hoax. Untuk melakukan klasifikasi data dan

(4)

Copyright: ©2023 by authors. https://jurnal.murnisadar.ac.id/index.php/Tekinkom/

457

memprediksi jenis berita, penelitian ini menggunakan algoritma Naive Bayes.

Tahapan pertama yang dilakukan dalam klasifikasi niave bayes ini adalah preprocessing atau pengolahan awal data melalui 4 tahapan yaitu tokenisasi, transform cases, stopwords dan terakhir tokenize by length.

Gambar 2. Preprocessing Documents 3.2 Proses Tokenisasi Data Teks

Seperti yang dijelaskan pada pembahasan Sebelumnya pada tahap Preprocessing (pra- pemrosesan), Proses tokenisasi data teks adalah menyelesaikan rangkaian kalimat dengan membagi potongan-potongan karakter atau kata-kata, sering disebut token, untuk menjadi kata-kata yang memiliki arti khusus. contoh kata “berkomentar” memiliki bobot 0.207 yang menandakan kata “berkomentar” memiliki nilai berdasarkan algoritma tokenize yang ada pada rapid miner.

Gambar 3. Proses Tokenisasi

3.3 Transform Case

Tabel 1. Tapilan Hasil Transform Case Teks sebelum dilakukan

proses Transform Case.

Teks setelah dilakukan proses Transform Case.

MANTAN PRESIDEN RI KE 3 DI NOBATKAN SEBAGAI PEMILIK IQ TERTINGGI SEPANJANG SEJARAH MANUSIA NAMUN DI SIA SIAKAN OLEH BANGSA Indonesia

mantan presiden ri ke 3 di nobatkan sebagai pemilik iq tertinggi sepanjang sejarah manusia namun di sia siakan oleh bangsa Indonesia

3.3.2 Filter Stopwords

Tabel 2. Tampilan Hasil Filter Stopword Teks sebelum dilakukan

proses Filter Stopword

Teks setelah dilakukan proses Filter Stopword MANTAN PRESIDEN

RI KE 3 DI NOBATKAN SEBAGAI PEMILIK IQ TERTINGGI SEPANJANG

SEJARAH MANUSIA NAMUN DI SIA SIAKAN OLEH BANGSA Indonesia

mantan presiden ri ke 3 di nobatkan pemilik iq tertinggi sejarah manusia sia siakan oleh bangsa indonesia

3.4 Filter Tokens (By Length)

Tabel 3. Tampilan Hasil Filter Tokens (By Length)

Teks sebelum dilakukan proses Transform Case.

Teks setelah dilakukan proses Filter Tokens (By

Length) MANTAN PRESIDEN RI

KE 3 DI NOBATKAN SEBAGAI PEMILIK IQ TERTINGGI

SEPANJANG SEJARAH MANUSIA NAMUN DI SIA SIAKAN OLEH BANGSA Indonesia

mantan presiden 3 nobatkan pemilik tertinggi sejarah manusia siakan oleh bangsa Indonesia

3.5 Perhitungan Manual Klasifikasi Algoritma Naive Bayes

Setelah melakukan tahap preprocessing, selanjutnya akan dilakukan Perhitungan manual dengan 2 perhitungan, perhitungan yang pertama yaitu dengan menggunakan Label 0 (Fakta) dan perhitungan yang kedua menggunakan Label 1 (Hoax).

Dalam perhitungan manual menggunakan ExampleSet sebanyak 27 contoh dengan jumlah

(5)

Copyright: ©2023 by authors. https://jurnal.murnisadar.ac.id/index.php/Tekinkom/

458

Term Label 0 (Fakta) 190 dan Jumlah Term Label 1 (Hoax) 157 .

Gambar 4. Tampilan Example Set 3.6 Perhitungan Label 0 (Fakta)

Contoh ExampleSet untuk Label 0 (Fakta)

“prosedur terkait kepolisian kawan keterangan”

Tabel 4. Perhitungan Label 0 (Fakta)

N o.

Term

Frekuensi Pada Data

Peluang Kemunculan Term

Label 0 (Fakta)

Label 1 (Hoax)

Label 0 (Fakta)

Label 1 (Hoax) 1. Prose

dur

1 0 1,05x10

⁻² 6,36x10⁻³ 2. Terk

ait

1 1 1,05x10

⁻²

1,27x10⁻² 3. Kepo

lisian

2 0 1,57x10

⁻²

6,36x10⁻³ 4. Kaw

an

1 0 1,05x10

⁻²

6,36x10⁻³ 5. Keter

anga n

1 0 1,05x10

⁻² 6,36x10⁻³ Jumlah Peluang Kemunculan

Term

0,0577 0,03804

Seperti pada tabel 4, kelas 0 (fakta) memiliki probabilitas 0,0577, sementara kelas 1 (Hoax) memiliki probabilitas 0,03804.

Karena probabilitas kelas 0 lebih tinggi, maka prediksinya kelas 0 (fakta).

3.7 Perhitungan Label 1 (Hoax)

Contoh ExampleSet untuk Label 1 (Hoax)

“manfaat poligami perpanjang umur pria”

Tabel 5. Perhitungan Label 1 (Hoax)

No Term

Frekuensi Pada Term

Peluang Kemunculan

Term Label

0 (Fakta)

Label 1 (Hoax)

Label 0 (Fakta)

Label 1 (Hoax)

1. manfaat 0 1 5,26

x10⁻³

1,27x1 0⁻²

2. Poligami 0 1 5,26

x10⁻³

1,27x1 0⁻² 3. perpanjan

g

0 1 5,26

x10⁻³

1,27x1 0⁻²

4. umur 0 1 5,26

x10⁻³ 1,27x1 0⁻²

5. pria 0 1 5,26

x10⁻³ 1,27x1 0⁻² Jumlah Peluang Kemunculan Term 0,0263 0,0635

Pada Tabel di atas menunjukkan probabilitas dari Label 1 (Hoax) 0,0635 lebih tinggi daripada probabilitas dari Label 0 (Fakta) 0,0263.

Dalam Naive Bayes, probabilitas lebih tinggi menentukan klasifikasi, jadi data tersebut dianggap sebagai Hoax.

3.8 Model Klasifikasi Algoritma Naive Bayes Setelah menghitung manual Proses Gambar 5 menjelaskan proses penggabungan langkah demi langkah dari semua pra-pemrosesan sebelumnya, dengan data sebanyak 4231 data, terdiri dari 6 atribut yaitu ID, Tanggal, Judul, Narasi, Nama File Gambar, Setelah melakukan tahap preprocecing tersisa 4048 data yang tersimpan dalam bentuk csv.

Pengujian ini di atas menggunakan algoritma Naive Bayes dan cross-validation dan Tidak menggunakan metode membagi data menjadi data latih dan data uji karena diilustrasikan dengan menggunakan Fungsi cross-validation, dimana data dibagi menjadi dua subset yaitu data proses pembelajaran dan data validasi/ Evaluasi. Subset pembelajaran melatih dan memvalidasi model atau algoritma.

Gambar 5. Model klasifikasi Naive Bayes

(6)

Copyright: ©2023 by authors. https://jurnal.murnisadar.ac.id/index.php/Tekinkom/

459

3.9 Proses Validation

Proses validasi dalam konteks algoritma klasifikasi Naive Bayes melibatkan pembagian data, pelatihan model naive bayes, pengujian model naive bayes dan evaluasi perfoma.

Gambar 6. Tampilan Proses Validation dalam Klasifikasi Naive Bayes

3.10 Hasil Evaluasi Cross Validation

Algoritma yang digunakan pada Cross Validation adalah model naïve bayes dengan penerapan pada rapid miner.

Gambar 7. Folds Validation

Pada Gambar 7 di atas memiliki parameter dengan set folds dengan pengujian mengunakan cross validation dilakukan 10 kali lalu kemudian dirata-ratakan untuk mendapatkan hasil validasi yang lebih baik.

Confusion Matrix

Gambar 8. Tampilan Confusion Matrix Berdasarkan hasil evaluasi dari Gambar 8 di atas, akurasi model yang diperoleh adalah 73.91% dengan deviasi sebesar 1.04%. Akurasi mengukur sejauh mana model dapat memprediksi

dengan benar pada data yang dievaluasi. Dalam hal ini, akurasi 73.91% menunjukkan bahwa model melakukan prediksi dengan benar untuk sekitar 73.91% dari total sampel yang dievaluasi. Selain itu,

"micro average" pada akurasi mengindikasikan bahwa pengukuran akurasi dilakukan secara keseluruhan terhadap seluruh dataset, tanpa mempertimbangkan kelas-kelas individual. Dalam konteks ini, nilai akurasi mikro 73.91%

menunjukkan bahwa model secara keseluruhan memiliki kinerja yang baik dalam memprediksi kelas secara umum.

Classification report

Hasil evaluasi disajikan pada Gambar 9.

Gambar 9. Tampilan Classification report Berikut adalah interpretasi dari masing- masing metrik evaluasi yang terdapat pada pada Gambar 9:

1. Akurasi (Accuracy): Akurasi model adalah 73.91% dengan deviasi sebesar 1.04%. Ini mengindikasikan bahwa model Anda melakukan prediksi dengan benar untuk sekitar 73.91% dari total sampel yang dievaluasi.

2. Confusion Matrix menunjukkan jumlah prediksi yang benar dan salah untuk setiap kelas. Dalam kasus ini, terdapat dua kelas, yaitu kelas 1 dan kelas 0. Dari matriks kebingungan, dapat dilihat bahwa:

Untuk kelas 1, terdapat 2913 prediksi benar dan 552 prediksi salah.

Untuk kelas 0, terdapat 214 prediksi benar dan 552 prediksi salah.

3. Presisi (Precision): Presisi mengukur sejauh mana prediksi positif yang benar dibandingkan dengan total prediksi positif. Dalam kasus ini, presisi untuk kelas 0 (positive class) adalah 27.88% dengan deviasi sebesar 2.24%. Ini

(7)

Copyright: ©2023 by authors. https://jurnal.murnisadar.ac.id/index.php/Tekinkom/

460

berarti sekitar 27.88% dari prediksi positif untuk kelas 0 adalah benar.

4. Recall: Recall mengukur sejauh mana model dapat mengidentifikasi sampel yang sebenarnya termasuk dalam suatu kelas.

Dalam kasus ini, recall untuk kelas 0 adalah 27.93% dengan deviasi sebesar 4.12%. Ini menunjukkan bahwa sekitar 27.93% dari sampel yang sebenarnya termasuk dalam kelas 0 berhasil diidentifikasi oleh model.

5. AUC (Area Under the Curve): AUC adalah metrik yang mengukur kualitas keseluruhan dari kurva ROC (Receiver Operating Characteristic). Dalam kasus ini, AUC (optimistic) adalah 0.885 dengan deviasi sebesar 0.009, AUC adalah 0.511 dengan deviasi sebesar 0.022, dan AUC (pessimistic) adalah 0.234 dengan deviasi sebesar 0.032.

Semakin tinggi nilai AUC, semakin baik kemampuan model dalam membedakan antara kelas positif dan negatif.

4. KESIMPULAN

Berdasarkan penelitian ini, dapat disimpulkan bahwa penerapan Data Mining menggunakan Algoritma Naive Bayes dalam klasifikasi berita hoax berhasil memberikan hasil yang signifikan. Hasil evaluasi model menunjukkan akurasi sebesar 73.91%, dengan deviasi sebesar 1.04%. Meskipun hasil ini menunjukkan performa yang baik, namun perlu diingat bahwa evaluasi kinerja model juga melibatkan parameter lainnya, seperti presisi, recall, dan AUC.

Proses preprocessing data, termasuk tokenisasi, transformasi case, filter stopwords, dan filter tokens (by length), membantu meningkatkan kualitas data yang dianalisis.

Dengan menggunakan metode ini, model Naive Bayes dapat memprediksi dengan benar sebagian besar sampel yang dievaluasi. Hasil perhitungan manual dan implementasi model klasifikasi Naive Bayes pada dataset berita hoax menunjukkan bahwa model mampu mengklasifikasikan berita dengan akurasi yang memadai.

5. REFERENSI

[1] D. Y. Siringoringo, V. Sihombing, and M.

Masrizal, “Sistem Informasi Penjualan

Dan Persediaan Produk Peralatan Pertanian Berbasis Web,” J. Tek. Inf. dan Komput., vol. 4, no. 1, pp. 54–59, 2021, doi:

10.37600/tekinkom.v4i1.232.

[2] J. Simatupang and S. Sianturi, “Perancangan Sistem Informasi Pemesanan Tiket Bus Pada PO. Handoyo Berbasis Online,” J. Intra- Tech, vol. 3, no. 2, pp. 11–25, 2019.

[3] S. P. Tamba, D. R. Hia, D. Prayitna, and ...,

“Pemanfaatan Teknologi Berbasis Mobile Untuk Manajemen Kontrol Nilai Dan Absensi Siswa Pada Mts Al-Ittihadiyah Medan,” J. Sains Dan …, vol. 2, no. 1, pp.

18–22, 2020.

[4] S. P. Tamba, M. Sitanggang, B. C.

Situmorang, and G. Laura, “APPLICATION OF DATA MINING TO DETERMINE THE LEVEL OF FISH SALES IN PT . TRANS RETAIL WITH FP-GROWTH METHOD,” vol. 10, no. 2, pp. 905–913, 2022.

[5] V. M. M. Siregar, E. Damanik, M. R.

Tampubolon, E. I. Malau, E. P. S. Parapat, and D. S. Hutagalung, “Sistem Informasi Administrasi Pinjaman (Kredit) Pada Credo Union Modifikasi (CUM) Berbasis Web,” J.

Tekinkom, vol. 3, no. 2, pp. 62–69, 2020, doi:

10.37600/tekinkom.v3i2.193.

[6] H. A. Simbolon and V. M. M. Siregar,

“Perancangan Sistem Informasi Berbasis E- Commerce Untuk Peningkatan Penjualan Produk Jersey Olah Raga,” J. Tek. Inf. dan Komput., vol. 1, no. 2, pp. 49–54, 2018.

[7] V. M. M. Siregar and N. F. Siagian, “Sistem Informasi Front Office Untuk Peningkatan Pelayanan Pelanggan Dalam Reservasi Kamar Hotel,” J. Tek. Inf. dan Komput., vol.

4, no. 1, pp. 77–82, 2021, doi:

10.37600/tekinkom.v4i1.279.

[8] F. Sinuraya et al., “WEB-BASED FOOD ORDERING INFORMATION SYSTEM STUDI,” pp. 7–11, 2021.

[9] F. A. Sianturi, “Penerapan Algoritma Apriori Untuk Penentuan Tingkat Pesanan,”

(8)

Copyright: ©2023 by authors. https://jurnal.murnisadar.ac.id/index.php/Tekinkom/

461

Mantik Penusa, vol. 2, no. 1, pp. 50–57, 2018.

[10] H. Mustofa and A. A. Mahfudh,

“Klasifikasi Berita Hoax Dengan Menggunakan Metode Naive Bayes,”

Walisongo J. Inf. Technol., vol. 1, no. 1, p.

1, Nov. 2019, doi:

10.21580/wjit.2019.1.1.3915.

[11] L. Ishwara, Catatan-catatan jurnalisme dasar. Penerbit Buku Kompas, 2005.

[12] V. Agarwal, H. P. Sultana, S. Malhotra, and A. Sarkar, “Analysis of Classifiers for Fake News Detection,” Procedia Comput.

Sci., vol. 165, pp. 377–383, 2019, doi:

10.1016/j.procs.2020.01.035.

[13] H. Septanto, “Pengaruh Hoax dan Ujaran Kebencian Sebuah Cyber Crime dengan Teknologi Sederhana di Kehidupan Sosial Masyarakat,” J. Sains dan Teknol., vol. 5, no. 2, pp. 157–162, 2018.

[14] M. Iqbal, “Efektifitas Hukum dan Upaya Menangkal Hoax sebagai Konsekuensi Negatif Perkembangan Interkasi Manusia,” Angew. Chemie Int. Ed. 6(11), 951–952., vol. 3, no. 1, pp. 10–27, 2018.

[15] S. Asur and B. A. Huberman, “Predicting the Future with Social Media,” in 2010 IEEE/WIC/ACM International Conference on Web Intelligence and Intelligent Agent Technology, Aug. 2010, pp. 492–499. doi: 10.1109/WI- IAT.2010.63.

[16] A. Qayyum, J. Qadir, M. U. Janjua, and F.

Sher, “Using Blockchain to Rein in the New Post-Truth World and Check the Spread of Fake News,” IT Prof., vol. 21, no. 4, pp. 16–24, Jul. 2019, doi:

10.1109/MITP.2019.2910503.

[17] C. Juditha, “Hoax Communication Interactivity in Social Media and Anticipation (Interaksi Komunikasi Hoax di Media Sosial serta Antisipasinya),” J.

Pekommas, vol. 3, no. 1, p. 31, Sep. 2018, doi: 10.30818/jpkm.2018.2030104.

[18] C. S. Sriyano and E. B. Setiawan,

“Pendeteksian Berita Hoax Menggunakan Naive Bayes Multinomial Pada Twitter dengan Fitur Pembobotan TF-IDF,” e- Proceeding Eng., vol. 8, no. 2, pp. 3396–

3405, 2021.

[19] R. Wati, “Penerapan Algoritma Naive Bayes Dan Particle Swarm Optimization Untuk Klasifikasi Berita Hoax Pada Media Sosial,”

JITK (Jurnal Ilmu Pengetah. dan Teknol.

Komputer), vol. 5, no. 2, pp. 159–164, 2020, doi: 10.33480/jitk.v5i2.1034.

[20] H. Muhabatin, C. Prabowo, I. Ali, C. L.

Rohmat, and D. R. Amalia, “Klasifikasi Berita Hoax Menggunakan Algoritma Naïve Bayes Berbasis PSO,” INFORMATICS Educ. Prof. J. Informatics, vol. 5, no. 2, p.

156, Jun. 2021, doi:

10.51211/itbi.v5i2.1531.

[21] F. Prasetya and F. Ferdiansyah, “Analisis Data Mining Klasifikasi Berita Hoax COVID 19 Menggunakan Algoritma Naive Bayes,” J. Sist. Komput. dan Inform., vol. 4, no. 1, p. 132, 2022, doi:

10.30865/json.v4i1.4852.

[22] G. P. McLeod, Raymond, Jr; Schell, Sistem informasi manajemen. Jakarta: Salemba Empat, 2008.

[23] T. Arifin, “Metode Data Mining Untuk Klasifikasi Data Sel Nukleus Dan Sel Radang Berdasarkan Analisa Tekstur,”

Informatika, vol. II, no. 2, pp. 425–433, 2015.

[24] M. R. Fadli, “Memahami desain metode penelitian kualitatif,” Humanika, vol. 21, no.

1, pp. 33–54, 2021, doi:

10.21831/hum.v21i1.38075.

[25] S. Mujilahwati, “PRE-PROCESSING TEXT MINING PADA DATA TWITTER,”

Semin. Nas. Teknol. Inf. dan Komun. 2016 (SENTIKA 2016), 2016.

[26] Saruni Dwiasnati and Yudo Devianto,

“Classification of forest fire areas using machine learning algorithm,” World J. Adv.

(9)

Copyright: ©2023 by authors. https://jurnal.murnisadar.ac.id/index.php/Tekinkom/

462

Eng. Technol. Sci., vol. 3, no. 1, pp. 008–

015, Jul. 2021, doi:

10.30574/wjaets.2021.3.1.0048.

[27] R. Hari Nugraha, E. Yuwono, L.

Prasetyohadi, Y. B. Arief, H. Patria, and I.

Teknologi Sepuluh Nopember Jl,

“Analisis Konsumsi Energi Listrik Pelanggan Dan Biaya Pokok Produksi Penyediaan Energi Listrik dengan Machine Learning,” J. Sains Komput.

Inform. (J-SAKTI, vol. 6, no. 1, pp. 47–56, 2022.

[28] L. Dhande and G. K. Patnaik, “Analyzing sentiment of movie review data using Naive Bayes neural classifier,” Int. J.

Emerg. Trends Technol. Comput. Sci., pp.

313–320, 2014.

[29] R. R. Sani, Y. A. Pratiwi, S. Winarno, E.

D. Udayanti, and F. Alzami, “Analisis Perbandingan Algoritma Naive Bayes Classifier dan Support Vector Machine untuk Klasifikasi Berita Hoax pada Berita Online Indonesia,” J. Masy. Inform., vol.

13, no. 2, pp. 85–98, 2022, doi:

10.14710/jmasif.13.2.47983.

Referensi

Dokumen terkait

Berdasarkan uraian latar belakang diatas maka permasalahan pada penelitian ini adalah Bagaimana menerapkan data mining dengan menggunakan algoritma Naive Bayes

Algoritma Naive Bayes Classifier dapat diimplementasikan untuk klasifikasi ketepatan waktu lulus mahasiswa dan menghasilkan prosentase klasifikasi yang cukup bagus,

Tujuan dari penelitian ini yaitu membuktikan performa atau peningkatan akurasi Particle Swarm Optimization pada metode Naive Bayes untuk klasifikasi review positif dan

Berdasarkan pemaparan dari penelitian sebelumnya, maka peneliti akan melakukan komparasi algoritma Support Vector Machine (SVM) dan Naive Bayes (NB) pada

Algoritma Naive Bayes berbasis Backward Elimination bertujuan untuk melakukan klasifikasi nasabah asuransi dengan hasil akurasi 85,89 % dengan delapan atribut weight

Klasifikasi nantinya akan menerapkan algoritma Naive Bayes, dengan skenario uji dataset menggunakan pembagian persentase (percentage split), yaitu membagi jumlah

Penulis ingin melakukan penelitian klasifikasi sentimen menggunakan metode Multinomial Naive Bayes yang serupa dengan penilitian “Algoritma Multinomial Naïve Bayes Untuk Klasifikasi

Penelitian kami bertujuan untuk melakukan prediksi klasifikasi kualitas ikan nilem berdasarkan ukuran dengan menggunakan algoritma Naive Bayes.. Prediksi kualitas ikan nilem yang