• Tidak ada hasil yang ditemukan

View of Klasifikasi Opini Terhadap Resesi Indonesia 2023 pada Twitter Menggunakan Algoritma Decesion Tree

N/A
N/A
Protected

Academic year: 2024

Membagikan "View of Klasifikasi Opini Terhadap Resesi Indonesia 2023 pada Twitter Menggunakan Algoritma Decesion Tree"

Copied!
9
0
0

Teks penuh

(1)

Universitas Multi Data Palembang | 1

KLASIFIKASI OPINI TERHADAP RESESI INDONESIA 2023 PADA TWITTER MENGGUNAKAN ALGORITMA DECESION TREE

Gilbert Agus Trianto1*), Muhammad Fauzan Marzuki2, Teo Yulio Sihotang3 & Hafidz Irsyad4

1234 Program Studi, Informatika, Fakultas Ilmu Komputer dan Rekayasa, Universitas Multi Data Palembang

1[email protected], 2[email protected], 3[email protected],

4[email protected]

Kata kunci:

indonesia; opini; resesi;

sentiment.

Abstract: Sentiment analysis is a branch of research from Text Mining which carries out the process of classifying textual documents. Sentiment analysis is the extraction of a person's written opinions, feelings and judgments about a particular topic using natural language processing techniques. The global recession of 2023 begins to threaten the world. This situation can be seen from the various risks that have begun to emerge in the global economy.

Researchers conducted a sentiment analysis study on Twitter using the

#recession2023 hashtag using the Decision Tree method. The purpose of this research is to find out how accurate and what users think about

#recession2023. The search results using the Decision Tree algorithm yield an accuracy value of 89.86%, recall 82.64%, precision 84.22%, f1-point 83.32%.

From the evaluation results, it can be concluded that the Decision Tree algorithm works very well.

Abstrak: Analisis sentimen merupakan salah satu cabang penelitian dari Text Mining yang melakukan proses klasifikasi dokumen tekstual. Analisis sentimen adalah ekstraksi dari pendapat, perasaan, dan penilaian seseorang yang ditulis tentang topik tertentu menggunakan teknik pemrosesan bahasa alami. Resesi global tahun 2023 mulai mengancam dunia. Situasi ini terlihat dari berbagai risiko yang mulai muncul di perekonomian global. Peneliti melakukan kajian analisis sentimen pada Twitter dengan menggunakan tagar

#resesi2023 dengan menggunakan metode Decision Tree. Tujuan dari penelitian ini adalah untuk mengetahui seberapa akurat dan mengetahui pendapat pengguna tentang #resesi2023. Hasil pencarian menggunakan algoritma Decision Tree menghasilkan nilai Accuracy 89.86%, recall 82.64%, precision 84.22%, f1-point 83.32%. Dari hasil evaluasi yang dilakukan, dapat disimpulkan bahwa algoritma Decision Tree bekerja dengan sangat baik.

Trianto, dkk. (2023). Klasifikasi Opini Terhadap Resesi Indonesia 2023 Pada Twitter Menggunakan Algoritma Decesion Tree. MDP Student Conference 2023

PENDAHULUAN

Resesi global tahun 2023 mulai mengancam dunia. Situasi ini terlihat dari berbagai risiko yang mulai muncul di perekonomian global. Tingkat inflasi yang tinggi, nilai tukar dolar yang lebih kuat, krisis pangan masa perang. Presiden Indonesia Joko Widodo telah menyatakan bahwa Bank Dunia dan International Monetary Fund (IMF) memperkirakan ekonomi 60 negara terancam resesi global [1]. Resesi global ini dimulai dengan merebaknya COVID-19 di awal tahun 2020, memaksa pemerintah di seluruh dunia untuk

(2)

2 | Universitas Multi Data Palembang

memberlakukan lockdown yang melarang masyarakat untuk keluar rumah dan pergi bekerja, sehingga aktivitas ekonomi terhambat dan menyebabkan krisis ekonomi.

Peran masyarakat dalam membantu memperkuat perekonomian dan ketahanan Indonesia sangat dinantikan. Inflasi menyebabkan pengetatan kebijakan moneter bank sentral negara-negara Eropa dan Amerika dengan menaikkan suku bunga acuan, yang juga akan berdampak pada kebijakan bank sentral negara lain. Upaya yang dapat dilakukan untuk menghadapi kenaikan inflasi dan risiko resesi pada tahun 2023 antara lain mencari alternatif penghasilan tambahan di luar upah tetap, melakukan investasi yang aman yaitu deposito, emas dan surat berharga yang diterbitkan pemerintah, serta menentukan pengeluaran yang dilakukan [2].

Berita tentang resesi yang akan datang di Indonesia banyak dibicarakan oleh masyarakat Indonesia.

Sejak 1 Juni 2022 hingga 10 Januari 2023, 1.084 pengguna Twitter memposting diskusi tentang pelemahan ekonomi di Indonesia. Data tersebut diambil dari polling dengan menggunakan kata kunci Indonesia resesi di Twitter dalam penelitian ini. Hal ini menandakan adanya permasalahan perekonomian Indonesia yang mulai dibicarakan mengenai resesi dan ramai diperbincangkan oleh masyarakat Indonesia di Twitter sebelum Indonesia resmi memasuki resesi.

Dalam kicauan mereka, masyarakat Indonesia mengkhawatirkan masa depan ekonomi Indonesia dan ada pula yang optimis dengan kemampuan Indonesia bertahan dari resesi. Tentu saja, tweet yang berbeda ini memiliki pendapatnya sendiri, yang dapat menunjukkan apakah yang dikatakan penulis secara umum positif, netral, atau negatif. Oleh karena itu, teknik analisis sentimen dapat digunakan. Natural language processing merupakan inti pembelajaran data dari pengolahan dan penggalian opini publik sebagai teks untuk menentukan sentimen pada masing-masing opini [3].

Penelitian terdahulu mengenai Klasifikasi Opini Pengguna Media Sosial Twitter Terhadap JNT Di Indonesia dengan Algoritma Decision Tree [4], JNT Ekspress merupakan perusahaan yang bergerak dalam jasa pengiriman barang. JNT memiliki akses luas terhadap jasa pengiriman menjadikan JNT sebagai pilihan masyarakat dalam bilang jasa pengiriman. Banyaknnya masyarakat yang menggunakan jasa JNT menjadikan banyaknnya opini masyarakat terhadap layanan yang dilakukan oleh JNT, baik itu opini positif ataupun opini negatif. Penelitian ini menggunakan decision tree sebagai algoritma untuk melakukan pengelompokkan opini. Hasil penelitian ini mendapatkan nilai akurasi sebesar 94,12% dengan perbandigan data training dan data testing sebesar 90:10.

Pada penelitian ini membahas tentang klasifikasi opini terkait prediksi resesi yang akan terjadi di Indonesia pada tahun 2023. Dengan mengklasifikasi opini tersebut dapat dilihat tingkat kekhawatiran masyarakat dengan kondisi ekonomi di Indonesia terhadap pemberitaan resesi pada tahun 2023 ini.

Penelitian ini menggunakan 756 data tweet yang telah dibuat sebelum Indonesia resmi dinyatakan mengalami resesi. Sehingga selain dapat melihat tingkat kekhawatiran masyarakat, bisa juga untuk mengidentifikasi isu ekonomi yang terjadi. Sehingga dapat dijadikan acuan untuk mengambil tindakan oleh pihak yang memerlukan. Salah satunya adalah kementrian koordinator bidang perekonomian yang menangani permasalahan ekonomi yang terjadi di Indonesia[5].

METODE

Penelitian ini bertujuan untuk menghasilkan akurasi yang tinggi dalam klasifikasi opini laporan resesi ekonomi Indonesia 2023 di Twitter dengan menggunakan algoritma Decision Tree. Berikut ini adalah alur penelitian pada Gambar 1.

(3)

Universitas Multi Data Palembang | 3 Gambar 1. Tahapan Penelitian

Pengumpulan Data Set

Proses pengumpulan kumpulan data yang diperoleh dari pengambilan data yang berasal dari twitter dengan menggunakan kata kunci “resesi 2023” yang dilakukan pada tanggal 10 Januari 2023 dan didapat sebanyak 756 data. Pengambilan data dilakukan dengan teknik menggunakan API Twitter melalui Google Colab. Data crawling yang didapat di-import menjadi Excel dengan format CSV. Data yang telah diambil ini menjadi data setdalam penelitian.

Preprocessing Data

Tahapan selanjutnya adalah tahapan preprocessing data set. Preprocessing data dilakukan dalam beberapa tahapan. Tahapan preprocessing adalah dengan menyimpan data yang diperoleh sehingga data tersebut dapat diproses saat memodelkan dataset. Tahap preprocessing meliputi operasi untuk memperbaiki data set yang masih kotor karena terdapat simbol angka imbuhan huruf kapital dan lainnya[6], [7]. Tahapan untuk preprocessing data set adalah sebagai berikut:

Tokenize

Proses tokenize adalah proses untuk memecah karakter atau frasa menjadi potongan-potongan karakter atau kata yang sesuai dengan yang dibutuhkan.

Case Folding

Pada tahap ini digunakan untuk mengubah semua huruf besar menjadi huruf kecil semua yang masih ada dalam teks. Hal ini dilakukan agar ketika diolah dalam bentuk klasifikasi ada kesamaan huruf dan bebas dari kesalahan[8].

(4)

4 | Universitas Multi Data Palembang Filtering

Proses yang dilakukan saat filtering atau cleansing adalah demgam membuang beberapa kata yang tidak diperlukan setelah proses tokenize dengan menggnakan panjang karakter yang ingin ditentukan.

Stopword

Pada tahap ini, kata-kata yang tidak diperlukan akan dibuang seperti namun, tetap, ada, yang tidak memiliki arti sendiri jika dipisahkan dengan kata lain yang tidak terkait dengan kata sifat. Untuk proses stopword ini kami menggunakan library dari Sastrawi dalam bahasa Indonesia.

Stemming

Stemming berguna untuk mengurangi bentuk-bentuk infleksional serta juga kadang berbagai macam bentuk kata terkait, menjadi bentuk dasar kata yang sama.

TF-IDF

Pada tahap ini dilakukan konversi kata menjadi angka atau vektor, sedangkan TF-IDF digunakan untuk menentukan frekuensi sebuah kata dalam dokumen dan memberikan bobot pada setiap kata dalam setiap dokumen untuk mencari dan menghitung berapa kali kata tersebut muncul[9].

Decision Tree

Decision Tree adalah pohon terstruktur yang terdiri dari sekumpulan atribut yang akan diuji untuk tujuan memprediksi keluaran. ketika setiap simpul internal menunjukan pengujian pada atribut, hasil pengujian diwakili oleh setiap cabang, dan label kelas dipegang oleh setiap node[6] Dalam sebuah pohon keputusan node paling atas adalah simpul akar. Menentukan akar pohon dengan menggunakan gain tertinggi dari setiap atribut atau dengan menurut nilai indeks entropi terendah. Dengan terlebih dahulu mencari nilai entropy dengan menggunakan rumus pada persamaan satu. Selanjutnya perhitungan nilainya dapat dilihat pada persamaan 1 dan persamaan 2.

Entropy (S) ∑ (1)

Gain (S, A) = Entropy (S) = ∑ ||

|| (2) Keterangan:

S = himpunan A = atribut

n = junlah partisipasi atribut A

|Si| = jumlah kasus pada partisi ke=i

|S| = jumlah kasus dalam S

HASILDANPEMBAHASAN

Pada penelitian ini dataset yang digunakan diambil dari API Twitter. Pengambilan data dilakukan dengan teknnik crawling menggunakan API twitter melalui Google Colab [10]. Dataset yang diambil adalah sebanyak 830 data dengan label positif, negatif dan netral. Data yang telah diambil kemudian dimasukkan ke dalam bentuk excel menggunakan format CSV untuk memudahkan dalam proses pengolahan data dan tools yang digunakan dalam olah data adalah Google Colab. Menggunakan library pandas dan numpy sebagai modul yang populer dalam melakukan penelitian analisis data[11].

(5)

Universitas Multi Data Palembang | 5 Preprocesing

Data set yang telah di-import selanjutnya dilakukan tahap preprocessing. Data yang dimulai dengan Tokenize. Kode program untuk melakukan tokenize dapat dilihat pada gambar 2.

Gambar 2. Proses Tokenize pada Google Colab

Setelah dilakukan tokenize selanjutnya dilakukan case folding. Kode program untuk melakukan case folding dapat dilihat pada gambar 3.

Gambar 3. Proses Case Folding pada Google Colab

Setelah dilakukan case folding dilanjutkan dengan Filtering atau Cleansing. Kode program untuk melakukan case folding dapat dilihat pada gambar 4.

Gambar 4. Proses Filtering pada Google Colab

(6)

6 | Universitas Multi Data Palembang

Proses selanjutnya melakukan stopword. Kode program untuk melakukan case folding dapat dilihat pada gambar 5.

Gambar 5. Proses Stopword pada Google Colab

Selanjutnya dilakukan stemming. Kode program untuk melakukan case folding dapat dilihat pada gambar 6.

Gambar 6. Proses Stemming pada Google Colab

Kemudian didapat lah hasil sentimen pada dataset yang digunakan yaitu sebanyak 483 Positif, 251 Netral dan 22 Negatif. Diagram hasil sentimen dapat dilihat pada gambar 7.

Gambar 7. Hasil Sentimen pada Dataset

(7)

Universitas Multi Data Palembang | 7 TF-IDF

Setelah selesai melakukan tahap Preprocessing Data kemudian masuk ke tahap TF-IDF. Kode rogram untuk melakukan case folding dapat dilihat pada gambar 8.

Gambar 8. Proses TF-IDF Pada Google Colab

Kemudian menggunakan Word Cloud untuk mendapatkan kata yang paling banyak muncul pada dataset untuk ditampilkan. Hasil word cloud dapat dilihat pada gambar 9.

Gambar 9. Hasil Wordcloud Pada Dataset Decision Tree

Penerapan algoritma decision tree dimulai dengan melakukan splitting data untuk membagi data menjadi 70% data latih dan 30% data uji. Kode rogram untuk melakukan splitting data dapat dilihat pada gambar 10.

Gambar 10. Proses Splitting Data Pada Google Colab

Kemudian menggunakan algoritma decision tree dan menggunakan confusion matrix untuk menampilkan hasil accuracy, precision, recall, dan f1-score. Kode rogram untuk melakukan decision tree data dapat dilihat pada gambar 11.

(8)

8 | Universitas Multi Data Palembang

Gambar 11. Hasil Algoritma Decision Tree dan Confusion Matrix

Hasil akhir didapatkan nilai accuracy, precision, recall, dan f1-score dari pengujian data yang telah dilakukan. Hasil pengujian dapat dilihat pada tabel 1.

Tabel 1. Hasil penelitian Hasil Accuracy 89,86%

Predictio n

84,22%

Recall 82,64%

F1-Score 83,32%

SIMPULAN

Berdasarkan hasil penelitian yang telah dilakukan maka di dapat dengan menggunakan total 830 data Tweet dengan kata kunci ‘#resesi2023’ dan kemudian di filtering kembali mendapatkan hasil total data kesuluruhan 756 data Tweet dengan mendapatkan hasil labeling dengan jumlah data sentimen positif 483, negatif 22 dan netral 251. Kata yang paling banyak muncul dengan kata ‘dunia’ sebanyak 83 kemunculan,

‘perppu’ sebanyak 57, ‘resolus’ sebanyak 55, dan ‘antisipasi sebanyak 52 kemunculan kata. Dapat disimpulkan bahwa masyarakat Indonesia belum merasakan dampak yang terlalu mengkhawatirkan dari fenomena terjadinya resesi di tahun 2023 dengan melihat hasil labeling dari tweet yang ada menunjukan respon yang positif dari masyarakat Indonesia. Hal ini berdasarkan hasil penelitian dengan nilai accuracy 89,86%, precision 84,22%, recall 82,64%, dan f1-score 83,32%, adapun saran untuk pegembangan penelitian selanjutnya yaitu penelitian selanjutnya dapat menggunakan data yang berasal dari media sosial lain seperti Facebook dan Instagram agar lebih akurat dalam mengetahui opini masyarakat Indonesia terhadap fenomena resesi 2023 terhadap Indonesia. Selama penelitihan lebih lanjut yaitu dengan melakukan menerapkan penggunaan algoritma yang berbeda seperti KNN, Random Forest, Naïve Bayes dalam melakukan klasifikasi opini untuk mendapatkan hasil akurasi yang lebih baik.

(9)

Universitas Multi Data Palembang | 9 DAFTARPUSTAKA

[1] “Ancaman Resesi Global 2023.” https://bemuntar.com/Ancaman-Resesi-Global-2023/ (accessed Jan.

10, 2023).

[2] A. Rodani, “Kiat Mengatasi Laju Inflasi dan Ancaman Resesi Tahun 2023.”

https://www.djkn.kemenkeu.go.id/kanwil-kalbar/baca-artikel/15622/Kiat-Mengatasi-Laju-Inflasi-dan- Ancaman-Resesi-Tahun-2023.html (accessed Jan. 10, 2023).

[3] D. Wulandari and C. Dewi, “Analisis Sentimen pada Ulasan ‘Lazada’ Berbahasa Indonesia Menggunakan BM25 dan K-Nearest Neighbor (K-NN) dengan Perbaikan Kata Menggunakan Jaro Winkler Distance,” 2019. [Online]. Available: http://j-ptiik.ub.ac.id

[4] W. T. Handoko, E. Supriyanto, D. I. Purwadi, Z. Budiarso, and H. Listiyono, “Klasifikasi Opini Pengguna Media Sosial Twitter Terhadap JNT di Indonesia dengan Algoritma Decision Tree,” 2022.

[5] H. Limanseto, “Dancing in the Storm, Pemerintah Jaga Resiliensi Perekonomian Hadapi Ancaman Resesi Global 2023,” Kepala Biro Komunikasi, Layanan Informasi, dan Persidangan Kementerian Koordinator Bidang Perekonomian, 2022. https://www.ekon.go.id/publikasi/detail/4801/dancing-in- the-storm-pemerintah-jaga-resiliensi-perekonomian-hadapi-ancaman-resesi-global-2023 (accessed Jan. 10, 2023).

[6] C. Cahyaningtyas, Y. Nataliani, and I. R. Widiasari, “Analisis Sentimen pada Rating Aplikasi Shopee Menggunakan Metode Decision Tree Berbasis SMOTE,” AITI: Jurnal Teknologi Informasi, Vol. 18, No. 2, pp. 173–184, 2021.

[7] P. Astuti and N. Nuris, “Penerapan Algoritma KNN pada Analisis Sentimen Review Aplikasi Peduli Lindungi,” Computer Science (CO-SCIENCE), Vol. 2, No. 2, pp. 137–142, 2022, [Online]. Available:

https://www.pedulilindungi.id/

[8] R. Apriani et al., “Analisis Sentimen Dengan Naïve Bayes Terhadap Komentar Aplikasi Tokopedia,”

Jurnal Rekayasa Teknologi Nusa Putra, Vol. 6, No. 1, pp. 54–62, 2019.

[9] G. Kusumawardhana, “Analisis Sentimen Review Komentar pada Aplikasi Gojek Disitus Google Play Dengan Menggunakan Metode Support Vector Machine (SVM) Dan Particle Swarm Optimization (PSO),” 2020.

[10] Michael, “Analisis Sentimen Pengguna Twitter Menggunakan Metode Naive Bayes dalam Konteks Vaksinasi di Indonesia,” 2022.

[11] M. R. Pribadi, D. Manongga, H. D. Purnomo, I. Setyawan, and Hendry, “Sentiment Analysis of the PeduliLindungi on Google Play using the Random Forest Algorithm with SMOTE,” 2022 International Seminar on Intelligent Technology and Its Applications: Advanced Innovations of Electrical Systems for Humanity, ISITIA 2022 - Proceeding, pp. 115–119, 2022, doi:

10.1109/ISITIA56226.2022.9855372.

Referensi

Dokumen terkait

Berdasarkan hasil penelitian yang telah dilakukan maka dapat diambil kesimpulan bahwa analisis sentimen dari media sosial masyarakat memberikan tanggapan positif

Tabel 3.1 Data Sampel Dokumen Teks sentimen D1 film indonesia dengan sinematogfrafi terbaik positif D2 film drama keluarga chemistry kuat positif D3 sukses film ngeri ngeri sedap

Komparasi Algoritma Klasifikasi Naive Bayes Dan K-Nearest Neighbors Dalam Analisis Sentimen Terhadap Opini Film Pada Twitter Muhammad Muharrom 4.3 Analisa Hasil Komparasi Berdasarkan

21% SIMILARITY INDEX 20% INTERNET SOURCES 6% PUBLICATIONS 1% STUDENT PAPERS 1 7% 2 4% 3 4% 4 3% 5 1% 6 < 1% 7 < 1% 8 < 1% TERHADAP OPINI FILM PADA TWITTER ORIGINALITY

Hasil akurasi SIMPULAN Berdasarkan hasil dari proses pengujian yang telah dilakukan terhadap tweets sentimen terhadap opini masyarakat pada sea games kamboja 2023 dari media sosial

Pada penelitian ini, akan dilakukan analisis lanjutan atas penelitian sebelumnya dengan mengaplikasikan klasifikasi data atas hasil prediksi sentimen yang dilakukan dengan menggunakan 3