Copyright: ©2023 by authors. https://jurnal.murnisadar.ac.id/index.php/Tekinkom/
349
PENERAPAN NEURAL NETWORK LSTM DALAM MEMPREDIKSI SENTIMEN PENGGUNA TWITTER TERHADAP BITCOIN
Duta Pratama1), Salim Wijaya2). Sofian Ali Santosa3), Saut Parsaoran Tamba4)
1,2,3,4) Sains dan Teknologi, Universitas Prima Indonesia
email: [email protected], [email protected], [email protected], [email protected]
Abstract
This research aims to apply the Long Short-Term Memory (LSTM) Neural Network to predict Twitter user sentiment towards Bitcoin prices. Bitcoin, as the world's leading cryptocurrency, faces high price volatility influenced by external factors and market sentiment. Twitter has become a valuable source of information for market analysis, including sentiment towards Bitcoin. Several algorithms have been studied previously to predict sentiment towards cryptocurrencies, but LSTM has shown excellent results in text analysis and sequence-based data prediction. This research uses LSTM to account for temporal dependencies in Bitcoin tweet data. During testing, the implementation of Bitcoin sentiment prediction using the LSTM model achieved an accuracy rate of 96%, which shows the model's ability to make accurate predictions regarding the sentiment of Bitcoin tweets. The results of this research provide an important contribution to the development of Bitcoin trading strategies and understanding of the crypto market based on Twitter user sentiment. The results can be used by investors and business people to optimize investment decisions regarding Bitcoin.
Keywords: Bitcoin, Sentiment Analysis, Twitter, Artificial Neural Network, LSTM.
1. PENDAHULUAN
Bitcoin adalah salah satu jenis cryptocurrency yang paling dikenal dan paling populer di dunia saat ini. Diperkenalkan pada tahun 2009, Bitcoin telah mencapai ketenaran global sebagai bentuk mata uang digital yang terdesentralisasi, menggunakan teknologi blockchain untuk melacak dan mengamankan transaksi [1]. Salah satu masalah pada Bitcoin adalah volatilitas harga yang tinggi dan seringkali dipengaruhi oleh faktor-faktor eksternal seperti berita [2], peristiwa pandemi global Covid-19 [3], dan sentimen pasar [4].
Dalam studi sebelumnya [5] ditemukan bahwa dalam dunia keuangan modern, data sosial media, terutama Twitter, telah menjadi sumber informasi yang berharga untuk analisis pasar.
Twitter menyediakan platform di mana pengguna dapat berbagi pendapat dan pandangan mereka secara real-time, termasuk mengenai cryptocurrency seperti Bitcoin [6].
Analisis sentimen pengguna Twitter terhadap Bitcoin dapat memberikan wawasan yang berharga dalam memprediksi pergerakan harga dan tren pasar [7].
Terdapat beberapa algoritma yang telah diteliti untuk memprediksi sentimen terhadap Cryptocurrency yakni Support Vector Machine (SVM) dengan akurasi 71,3% [8], Naïve Bayes dengan akurasi 79,99% [9], dan LSTM dengan akurasi 91% [10]. Long Short-Term Memory (LSTM) adalah tipe arsitektur jaringan saraf rekurensi (Recurrent Neural Network) yang efektif dalam mengatasi masalah analisis teks dan prediksi berdasarkan urutan data [11].
Keunggulan LSTM terletak pada kemampuannya untuk memperhitungkan ketergantungan temporal dalam data urutan, yang sangat relevan dalam konteks sentimen Twitter terhadap harga Bitcoin [12].
Penelitian ini bertujuan untuk menerapkan Neural Network LSTM dalam
Copyright: ©2023 by authors. https://jurnal.murnisadar.ac.id/index.php/Tekinkom/
350
memprediksi sentimen pengguna Twitter terhadap harga Bitcoin sehingga diketahui apakah sentimen pasar positif, netral, atau negatif terhadap Bitcoin. Dengan menerapkan LSTM, prediksi sentimen pengguna Twitter terhadap Bitcoin yang dapat berguna bagi investor ataupun pembisnis di industri Bitcoin.
Dengan demikian, penelitian ini dapat memberikan kontribusi untuk pengembangan strategi perdagangan Bitcoin dan pemahaman tentang pasar kripto berdasarkan sentimen pengguna Twitter.
2. METODE PENELITIAN 2.1. Bitcoin
Bitcoin adalah mata uang digital yang pertama kali diperkenalkan pada tahun 2009 oleh seorang atau sekelompok pengembang yang menggunakan nama samaran "Satoshi Nakamoto". Bitcoin didasarkan pada teknologi blockchain yang memungkinkan transaksi peer- to-peer yang aman, transparan, dan terdesentralisasi. Bitcoin menjadi populer karena potensinya sebagai alternatif mata uang tradisional dan sebagai aset investasi. Nilai Bitcoin ditentukan oleh mekanisme pasar, dan volatilitasnya yang tinggi telah menarik perhatian banyak orang [5].
2.2. Twitter
Twitter adalah platform media sosial yang didirikan pada tahun 2006 oleh Jack Dorsey, Biz Stone, dan Evan Williams. Twitter memungkinkan pengguna untuk mengirim dan membaca pesan yang disebut "tweet" dalam batasan karakter tertentu. Platform ini telah menjadi salah satu platform media sosial paling populer di dunia, dengan jutaan pengguna yang aktif setiap hari. Twitter digunakan untuk berbagi informasi, pemikiran, berita terkini, dan opini publik tentang berbagai topik, termasuk Bitcoin [6].
2.3. Analisa Sentimen
Sentiment Analysis atau analisis sentimen adalah metode komputasional untuk menentukan, mengklasifikasikan, dan mengekstraksi sentimen atau opini yang terkandung dalam teks. Tujuan dari sentimen
analisis adalah untuk mengidentifikasi apakah suatu teks memiliki sentimen positif, negatif, atau netral terkait suatu subjek tertentu. Dalam konteks penelitian ini, sentimen analisis digunakan untuk menganalisis tweet pengguna Twitter terhadap Bitcoin [6].
2.4. Neural Network
Gambar 1. Arsitektur Neural Network
Neural Network (Jaringan Saraf Tiruan) adalah model komputasi yang terinspirasi oleh struktur dan fungsi otak manusia. Neural Network terinspirasi oleh struktur dan fungsi jaringan saraf biologis [13], [14], [15].
2.5. Long Short-Term Memory (LSTM
Gambar 2. Arsitektur LSTM
Long Short-Term Memory (LSTM) adalah jenis arsitektur atau varian dari Jaringan Saraf Tiruan (Neural Network) yang dirancang khusus untuk mengatasi masalah pemodelan dan prediksi pada data sekuensial. LSTM diperkenalkan pada tahun 1997 sebagai solusi untuk mengatasi masalah vanishing gradient
Copyright: ©2023 by authors. https://jurnal.murnisadar.ac.id/index.php/Tekinkom/
351
pada jaringan rekurensi tradisional. LSTM memiliki struktur yang kompleks dengan unit memori internal yang memungkinkan pemahaman konteks jangka panjang dan jangka pendek dalam data sekuensial [12].
Unit memori ini memungkinkan LSTM untuk menyimpan informasi dalam jangka waktu yang lama dan mengingatnya secara efektif saat diperlukan. Hal ini membuat LSTM sangat cocok untuk memodelkan dan memprediksi data yang memiliki dependensi jarak jauh dalam urutan, di mana informasi yang terjadi pada awal urutan dapat mempengaruhi hasil di bagian tengah atau akhir urutan [16]. Neural Network (Jaringan Saraf Tiruan) adalah model komputasi yang terinspirasi oleh struktur dan fungsi otak manusia [17]–[19]. Neural Network terinspirasi oleh struktur dan fungsi jaringan saraf biologis.
Untuk memastikan agar data dapat digunakan dengan baik oleh LSTM maka diperlukan proses text preprocessing yang akan membersihkan data agar dapat menghasilkan model LSTM yang lebih baik dan akurat [20].
3. HASIL DAN PEMBAHASAN
Pada penelitian ini, kami menerapkan arsitektur jaringan saraf LSTM untuk menganalisis dan memprediksi sentimen pengguna Twitter terhadap Bitcoin. Kami mengumpulkan data dari Twitter, yang melibatkan kata kunci terkait Bitcoin dan memprosesnya menggunakan proses Natural Language Processing (NLP) untuk menyiapkan data tersebut untuk LSTM.
3.1. Pengumpulan Data
Pengumpulan data diperlukan untuk mencapai tujuan dari penelitian ini yaitu memprediksi sentimen Twitter terkait Bitcoin.
Data tweet pengguna Twitter yang berisi kata kunci terkait Bitcoin dikumpulkan. Tampilan dataset yang dikumpulkan adalah sebagai berikut:
Gambar 3. Dataset Twitter Tentang Bitcoin yang Dikumpulkan
3.2. Preprocessing
Selanjutnya, preprocessing melibatkan proses pembersihan (cleaning), seperti menghapus tautan web, emoji, dan menghapus simbol-simbol non-alfanumerik yang tidak dapat diproses oleh algoritma LSTM. Kemudian, data tersebut diproses dengan teknik tokenisasi dan Lematization agar menjadi data vektor yang dapat dimengerti oleh algoritma LSTM.
Tabel 1. Hasil Perancangan Preprocessing Tipe Preprocessing Proses yang Dilakukan a. Tokenisasi Proses Tokenisasi
dilakukan menggunakan Tokenizer dari Keras yang berfungsi untuk mengkonversi teks menjadi urutan integer.
b. Padding Padding dilakukan dengan fungsi pad_sequences dari keras untuk memastikan bahwa semua urutan memiliki panjang yang sama. Hal ini penting karena model neural seperti LSTM memerlukan input dengan panjang yang sama.
c. Pembersihan Data
Menghapus URL, hashtag, dan mentions dari tweet, serta menghapus karakter non-alfabet. Selain itu,
Copyright: ©2023 by authors. https://jurnal.murnisadar.ac.id/index.php/Tekinkom/
352
dilakukan pula proses lemmatization, yang mengubah kata-kata ke bentuk dasar (misalnya,
"running" menjadi
"run").
d. Menghitung Subjektivitas dan Polaritas
Menggunakan paket TextBlob untuk
menghitung subjektivitas (sejauh mana teks berisi opini dibandingkan dengan fakta) dan polaritas (sejauh mana teks positif atau negatif) dari setiap tweet.
e. Pembuatan Target Sentimen
Membuat target sentimen berdasarkan perubahan harga Bitcoin selama tujuh hari. Jika harga Bitcoin naik, sentimennya dianggap positif; jika harga turun, sentimen dianggap negatif; dan jika harga tidak berubah, sentimennya dianggap netral.
3.3. Data Split
Setelah melalui Preprocessing, data kemudian dibagi menjadi set pelatihan dan set tes menggunakan fungsi train_test_split dari scikit-learn. Pembagian ini dengan perbandingan Train Data, Test Data dan Validation Data sebesar 60:20:20.
3.4. Training
Hasil training pada penelitian ini dapat dilihat pada grafik berikut ini.
Gambar 4. Hasil Training
Model yang telah dikembangkan menunjukkan tren peningkatan akurasi selama
periode pelatihan. Hal ini mencerminkan bahwa model semakin memahami dan belajar dari pola- pola yang terdapat dalam data latih, sehingga memungkinkan model untuk memprediksi hasil dengan tingkat ketepatan yang sangat tinggi.
Dengan demikian, performa ini menunjukkan bahwa model telah menginternalisasi pola dalam data dan mampu menerapkannya dengan efektif saat menghadapi data baru, menunjukkan kapabilitasnya dalam generalisasi.
Pada sisi lain, nilai 'loss' model, yang merupakan indikator dari kesalahan prediksi yang dibuat oleh model dibandingkan dengan nilai sebenarnya, menunjukkan penurunan yang signifikan selama proses pelatihan, menandakan performa model yang membaik. Namun, ada peningkatan 'loss' yang terlihat di tahap akhir pelatihan, yang bisa menandakan adanya fenomena overfitting; di mana model menjadi terlalu spesifik pada data latih dan mungkin menemui kesulitan saat menerapkan pengetahuannya pada data baru. Meskipun demikian, 'loss' yang relatif rendah pada tahap awal pelatihan menunjukkan bahwa model telah berhasil mengidentifikasi pola-pola kunci dalam data dan mengurangi kesalahan dalam prediksinya.
3.5. Testing
Dalam fase pengujian penelitian ini, model yang telah dilatih diterapkan pada dataset pengujian yang berisi tweet yang belum pernah dilihat sebelumnya oleh model. Tujuannya adalah untuk melihat seberapa baik model dapat memprediksi sentimen terhadap Bitcoin berdasarkan tweet baru. Jumlah data untuk fase pengujian atau testing adalah sebanyak 9.686 data tweet.
3.6. Evaluation
Setelah proses pelatihan selesai, model kemudian dievaluasi dan menghasilkan hasil evaluasi pada tabel berikut ini.
Tabel 1. Hasil Evaluasi
Sentimen Bitcoin Presisi Recall F1-Score
Copyright: ©2023 by authors. https://jurnal.murnisadar.ac.id/index.php/Tekinkom/
353
Negatif (0) 0.91 0.84 0.88 Netral (1) 0.98 0.98 0.98 Positif (2) 0.96 0.97 0.97 Rata-rata 0.95 0.93 0.94
Akurasi 0.96
4. KESIMPULAN
Dalam penelitian ini, model Neural Network LSTM telah berhasil dirancang untuk memprediksi sentimen pengguna Twitter terhadap Bitcoin. Hasilnya menunjukkan tingkat akurasi yang sangat baik, mencapai 96%, yang berarti model dapat membuat prediksi yang benar untuk 96% dari tweet bitcoin yang diuji pada penelitian ini. Penelitian ini dapat membuka peluang bagi investor dan bisnis terkait untuk memanfaatkan analisis sentimen tweet Twitter tentang Bitcoin dalam mengoptimalkan keputusan investasi Bitcoin.
5. REFERENSI
[1] A. S. B. Karno, W. Hastomo, D. Arif, and E. S. Moreta, “Optimasi Portofolio dan Prediksi Cryptocurrency Menggunakan Deep Learning Dalam Bahasa Python,” Semin. Nas. Teknol. Inf.
dan Komun. STI&K, vol. 4, no. 1, pp.
193–202, 2020.
[2] K. A. Coulter, “The impact of news media on Bitcoin prices: modelling data driven discourses in the crypto-economy with natural language processing,” R.
Soc. Open Sci., vol. 9, no. 4, Apr. 2022, doi: 10.1098/rsos.220276.
[3] M. Meiryani et al., “The effect of global price movements on the energy sector commodity on bitcoin price movement during the COVID-19 pandemic,”
Heliyon, vol. 8, no. 10, p. e10820, Oct.
2022, doi:
10.1016/j.heliyon.2022.e10820.
[4] Anamika, M. Chakraborty, and S.
Subramaniam, “Does Sentiment Impact Cryptocurrency?,” J. Behav. Financ., vol.
24, no. 2, pp. 202–218, Apr. 2023, doi:
10.1080/15427560.2021.1950723.
[5] A. D. Arisandi and L. Atika, “Prediksi
Mata Uang Bitcoin Menggunakan LSTM dan Analisis Sentimen pada Sosial Media,” vol. 19, pp. 559–566, 2020.
[6] R. Chandra, K. Gunadi, and S. Ananda,
“Aplikasi Sentiment Analysis terhadap Trend Cryptocurrency pada Platform Twitter Menggunakan Library Textblob sebagai Alat Bantu Berinvestasi,” J.
Infra, vol. 10, no. 2, pp. 397–403, 2022.
[7] J. V. Critien, A. Gatt, and J. Ellul,
“Bitcoin price change and trend prediction through twitter sentiment and data volume,” Financ. Innov., vol. 8, no.
1, p. 45, Dec. 2022, doi: 10.1186/s40854- 022-00352-7.
[8] A. Prasetya, F. Ferdiansyah, Y. N.
Kunang, E. S. Negara, and W. Chandra,
“Sentiment Analisis Terhadap Cryptocurrency Berdasarkan Comment Dan Reply Pada Platform Twitter,” J. Inf.
Syst. Informatics, vol. 3, no. 2, pp. 268–
277, Jun. 2021, doi:
10.33557/journalisi.v3i2.124.
[9] R. Azhar, A. Surahman, and C. Juliane,
“Analisis Sentimen Terhadap Cryptocurrency Berbasis Python TextBlob Menggunakan Algoritma Naïve Bayes,” J. Sains Komput. Inform.
(J-SAKTI, vol. 6, no. 1, pp. 267–281, 2022.
[10] K. Ramani, M. Jahnavi, P. J. Reddy, P.
VenkataChakravarthi, P. Meghanath, and S. K. Imran, “Prediction of Bitcoin Price through LSTM, ARIMA, XGBoost, Prophet and Sentiment Analysis on Dynamic Streaming Data,” in 2023 9th International Conference on Advanced Computing and Communication Systems (ICACCS), Mar. 2023, pp. 1514–1518.
doi:
10.1109/ICACCS57279.2023.10113014.
[11] M. R. Firmansyah, R. Ilyas, and F.
Kasyidi, “Klasifikasi Kalimat Ilmiah Menggunakan Recurrent Neural Network,” Pros. 11th Ind. Res. Work.
Natl. Semin., vol. 11, no. 1, pp. 488–495, 2020.
Copyright: ©2023 by authors. https://jurnal.murnisadar.ac.id/index.php/Tekinkom/
354
[12] R. Akbar, R. Santoso, and B. Warsito,
“PREDIKSI TINGKAT TEMPERATUR
KOTA SEMARANG
MENGGUNAKAN METODE LONG SHORT-TERM MEMORY (LSTM),” J.
Gaussian, vol. 11, no. 4, pp. 572–579,
Feb. 2023, doi:
10.14710/j.gauss.11.4.572-579.
[13] S. Samsudin, A. Ikhwan, R. A. Putri, and M. Badri, “Implementasi Algoritma Backpropagation Neural Networks Untuk Memprediksi Hasil Kinerja Dosen,” J.
Inf. Syst. Res., vol. 4, no. 2, pp. 410–417, Jan. 2023, doi: 10.47065/josh.v4i2.2685.
[14] V. M. Mulia Siregar and H. Sugara,
“Implementation of artificial neural network to assesment the lecturer‘s performance,” IOP Conf. Ser. Mater. Sci.
Eng., vol. 420, no. 1, p. 012112, Oct.
2018, doi: 10.1088/1757- 899X/420/1/012112.
[15] V. Marudut, M. Siregar, K. Sinaga, E.
Sirait, A. S. Manalu, and M. Yunus,
“Classification of Customer Satisfaction Through Machine Learning : An Artificial Neural Network Approach,”
IOTA, vol. 03, no. 3, pp. 273–282, 2023, doi: 10.31763/iota.v3i3.643.
[16] N. Aslam, F. Rustam, E. Lee, P. B.
Washington, and I. Ashraf, “Sentiment Analysis and Emotion Detection on Cryptocurrency Related Tweets Using Ensemble LSTM-GRU Model,” IEEE Access, vol. 10, pp. 39313–39324, 2022, doi: 10.1109/ACCESS.2022.3165621.
[17] I. G. N. L. Wijayakusuma and N. K.
Emik Sapitri, “Penerapan Jaringan Syaraf Tiruan Dalam Pembentukan Model Peramalan Angka Melek Huruf di Kabupaten Karangasem,” J. Mat., vol.
10, no. 1, p. 11, 2020, doi:
10.24843/jmat.2020.v10.i01.p119.
[18] M. F. Mubarokh, M. Nasir, and D.
Komalasari, “Jaringan Syaraf Tiruan Untuk Memprediksi Penjualan Pakaian
Menggunakan Algoritma
Backpropagation,” J. Comput. Inf. Syst.
Ampera, vol. 1, no. 1, pp. 29–43, 2020, doi: 10.51519/journalcisa.v1i1.3.
[19] F. Ayu, “Implementasi Jaringan Saraf Tiruan Untuk Menentukan Kelayakan Proposal Tugas Akhir,” It J. Res. Dev., vol. 3, no. 2, pp. 44–53, 2019, doi:
10.25299/itjrd.2019.vol3(2).2271.
[20] F. Yuspriyadi, “KLASIFIKASI
SENTIMEN TWITTER
MENGGUNAKAN LSTM,” Method. J.
Tek. Inform. dan Sist. Inf., vol. 9, no. 1, pp. 4–8, Mar. 2023, doi:
10.46880/mtk.v9i1.1720.