Estimasi Intensitas Depresi melalui Media Sosial:
Pendekatan Pembelajaran Mendalam
Shreya Ghosh, Anggota Mahasiswa Pascasarjana, IEEE , dan Tarique Anwar
Abstrak—Depresi telah menjadi masalah besar dalam masyarakat kita saat ini. Depresi juga menjadi alasan utama bunuh diri, terutama di kalangan remaja. Dalam wabah penyakit virus korona (COVID-19) saat ini, negara- negara yang terkena dampak telah merekomendasikan tindakan menjaga jarak sosial dan karantina wilayah. Tindakan ini mengakibatkan isolasi interpersonal dan menimbulkan kekhawatiran serius terhadap kesehatan mental dan depresi. Umumnya, psikolog klinis mendiagnosis orang yang depresi melalui wawancara tatap muka dengan mengikuti kriteria depresi klinis. Namun, pasien sering kali cenderung tidak berkonsultasi dengan dokter pada tahap awal depresi mereka. Saat ini, orang semakin banyak menggunakan media sosial untuk mengekspresikan suasana hati mereka.
Dalam artikel ini, kami bertujuan untuk memprediksi pengguna yang depresi serta memperkirakan intensitas depresi mereka melalui pemanfaatan data media sosial (Twitter), untuk membantu dalam membunyikan alarm. Kami memodelkan masalah ini sebagai tugas pembelajaran yang diawasi. Kami mulai dengan memberi label data Twitter secara lemah dengan cara yang diawasi sendiri. Seperangkat fitur yang lengkap, termasuk emosional, topik, perilaku, tingkat pengguna, dan terkait depresiNFitur-fitur -gram diekstraksi untuk mewakili setiap pengguna. Dengan menggunakan fitur-fitur ini, kami melatih jaringan memori jangka pendek (LSTM) kecil menggunakan Swish sebagai fungsi aktivasi, untuk memprediksi intensitas depresi. Kami melakukan eksperimen ekstensif untuk menunjukkan kemanjuran metode kami. Kami mengungguli model dasar untuk estimasi intensitas depresi dengan mencapai kesalahan kuadrat rata-rata terendah sebesar 1,42 dan juga mengungguli metode klasifikasi biner canggih yang ada dengan akurasi lebih dari 2%. Kami menemukan bahwa pengguna yang depresi sering menggunakan kata-kata negatif seperti stres dan sedih, sebagian besar memposting pada larut malam, sangat menggunakan kata ganti orang dan terkadang juga berbagi kejadian pribadi.
Ini dapat menjadi masalah kesehatan yang serius jika berlangsung lebih dari dua minggu dengan intensitas sedang atau berat. Ini dapat memengaruhi pikiran dan kesehatan fisik seseorang. Akibatnya, orang yang depresi tidak dapat berfungsi dengan baik di tempat kerja dan berperilaku buruk terhadap keluarga dan orang-orang terdekat. Bahkan dapat menyebabkan bunuh diri jika orang yang depresi tidak menerima perawatan yang tepat.
Setiap tahun sekitar 800.000 orang meninggal karena bunuh diri. Ini adalah penyebab kematian terbanyak kedua di kalangan remaja. Situasinya paling buruk di negara-negara seperti India, Tiongkok, dan AS, jika dibandingkan dengan skenario global. India dikatakan sebagai negara dengan tingkat depresi tertinggi di dunia. Menurut WHO [4], India, Tiongkok, dan AS adalah korban terburuk dari kecemasan, skizofrenia, dan gangguan bipolar.
Meskipun memiliki perawatan yang tepat dan efektif untuk depresi, tidak banyak orang di antara mereka yang terkena dampak dapat menerima perawatan tersebut karena berbagai alasan. Di banyak negara, hanya sekitar 10% yang datang untuk perawatan. Alasan utama di balik statistik yang buruk ini adalah stigma sosial yang terkait dengan gangguan mental.
Kendala lain yang terkait dengan perawatan yang efektif meliputi penilaian yang tidak akurat, kurangnya sumber daya, dan kurangnya penyedia layanan kesehatan yang terlatih. Bahkan lebih dari 70% orang tidak akan berkonsultasi dengan psikolog pada tahap awal depresi mereka, yang selanjutnya menyebabkan memburuknya kesehatan mental.
Istilah Indeks—COVID-19, pembelajaran mendalam, estimasi intensitas depresi, kesehatan mental, penambangan media sosial.
A. COVID-19 dan Depresi
Wabah penyakit virus corona (COVID-19) saat ini tidak hanya memengaruhi kita secara fisik, tetapi juga psikologis. Ini adalah situasi khusus dan langka yang berdampak dalam berbagai cara dalam skala internasional, termasuk perubahan dalam gaya hidup kita secara
keseluruhan. Langkah-langkah menjaga jarak sosial dankuncitara diterapkan di beberapa negara yang terkena dampak telah menyebabkan isolasi interpersonal dan perubahan ekstrem dalam kehidupan sehari-hari kita.
Konsekuensi lain pada kehidupan orang-orang termasuk kehilangan pekerjaan, ketidakamanan finansial, kekerasan dalam rumah tangga, dan kejahatan dunia maya. Kondisi-kondisi ini secara keseluruhan telah menimbulkan kekhawatiran serius akan stres, kecemasan, dan depresi [5].
Dengan beban kerja yang berlebihan dalam keadaan yang penuh tekanan, para pekerja layanan kesehatan juga sangat rentan terhadap depresi, kecemasan, dan insomnia [6]. Pappadan lain-lain.[6] menekankan perlunya membangun cara untuk mengurangi risiko kesehatan mental pekerja layanan kesehatan dalam kondisi pandemi saat ini. Psikolog dan ilmuwan sosial merenungkan bahwa COVID-19 dapat menyebabkan epidemi depresi klinis dan sistem layanan kesehatan kita jauh tertinggal dalam hal perawatan yang tepat [7]. Lebih lanjut, Dresden [8] melaporkan bahwa, sama seperti COVID-19 dapat menjadi jauh lebih berbahaya dengan
Aku. Aku
PENGANTARD
EPRESI merupakan salah satu penyebab penderitaan dan kematian yang paling sering diabaikan di dunia, terutama di kalangan dewasa muda. Penting untuk memahami dan menyadari dampak negatif yang luas dari pembunuh diam-diam ini [1]. Menurut WHO [2], lebih dari 264 juta orang di seluruh dunia terkena dampaknya dan jumlahnya terus bertambah setiap harinya. Depresi sama sekali berbeda dari fluktuasi suasana hati dan respons emosional sesaat yang biasa kita hadapi dalam kehidupan sehari-hari [3].Naskah diterima 12 Mei 2020; direvisi 24 April 2021; diterima 12 Mei 2021.(Penulis koresponden: Tarique Anwar.)
Shreya Ghosh bekerja di Departemen Ilmu Komputer dan Teknik, IIT Ropar, Rupnagar 140001, India. Sekarang ia bekerja di Fakultas Teknologi Informasi, Universitas Monash, Melbourne, VIC 3168, Australia (e-mail:
Tarique Anwar bekerja di Departemen Komputasi, Universitas Macquarie, Sydney, NSW 2109, Australia, dan juga di Data61 CSIRO, Eveleigh, NSW 2122, Australia (e-mail: [email protected] ).
Pengidentifikasi Objek Digital 10.1109/TCSS.2021.3084154
2329-924X © 2021 IEEE. Penggunaan pribadi diperbolehkan, tetapi penerbitan ulang/distribusi ulang memerlukan izin IEEE.
Lihat https://www.ieee.org/publications/rights/index.html untuk informasi lebih lanjut.
kondisi medis yang sudah ada sebelumnya, efek psikologis pandemi bisa jauh lebih buruk bagi orang dengan depresi yang sudah ada sebelumnya.
Dengan adanya penyakit yang sangat menular ini dan sistem perawatan kesehatan mental dengan layanan terbatas untuk menangani masalah kesehatan mental yang besar, permintaan untuk terapi jarak jauh meningkat pesat [9]. Layanan terapi obrolan teks dan video yang disebut Talkspace telah melihat peningkatan pelanggan sebesar 65% sejak pertengahan Februari 2020. Brightside adalah aplikasi seluler yang menawarkan perawatan dan pengobatan untuk kecemasan dan depresi.
Telah melihat peningkatan 50% dalam pengguna baru sejak awal kuartal.
Sebuah perusahaan terapi digital bernama Big Health merilis program berbasis teknik kognitif dan perilaku untuk memerangi kurang tidur dan kecemasan secara gratis. Lebih dari 50 perusahaan telah mendaftar atau memperluas penggunaan program mereka termasuk pemberi kerja besar seperti Nike, Target, dan jaringan supermarket HEB. Dengan tingginya permintaan untuk perawatan depresi dengan sumber daya terbatas di bawah keadaan ekstrem COVID-19, hal itu mendesak untuk pengembangan dukungan berbasis teknologi yang cepat dalam proses perawatan.
Gbr. 1. Analisis intensitas depresi dari media sosial pada skala BDI-II.
pada Gambar 1. Ini akan membantu pasien depresi tahap awal dengan intensitas rendah untuk mengambil tindakan pencegahan.
C. Kontribusi Kami
Dalam artikel ini, kami mengusulkan metode berbasis pembelajaran mendalam untuk memperkirakan intensitas depresi dengan menggunakan konten yang dibagikan oleh pengguna di platform media sosial. Sejauh pengetahuan kami, ini adalah karya pertama tentang estimasi intensitas depresi. Untuk memulainya, kami memberi label ulang pada kumpulan data depresi yang dibagikan oleh Shendan lain-lain.[19] dengan cara yang diawasi sendiri ke dalam kategori intensitas yang berbeda berdasarkan polaritas gabungan tekstual dan analisis semantik laten (LSA). Dengan
mempertimbangkan berbagai sifat depresi yang ditetapkan dalam literatur, kami merancang total 527 fitur dari lima jenis yang berbeda untuk menggambarkan setiap pengguna, yang mencakup fitur emosional, yang dipicu oleh peristiwa, perilaku, tingkat pengguna, dan yang terkait dengan depresi. Dengan menggunakan fitur yang diekstraksi, kami melatih jaringan memori jangka pendek (LSTM) yang dangkal untuk memprediksi intensitas depresi. Kami membandingkan hasil eksperimen kami dengan berbagai model lain untuk mengevaluasi estimasi intensitas kami. Lebih jauh, kami juga membandingkan metode kami (yang disesuaikan dengan klasifikasi biner) dengan metode klasifikasi biner yang ada dan mengunggulinya.
Singkatnya, kami memberikan kontribusi utama berikut dalam artikel ini.
B. Media Sosial Sebagai Alat Deteksi Depresi
Saat ini, orang-orang banyak menggunakan platform media sosial seperti Facebook, Twitter, Weibo, dan WhatsApp. Situs-situs media sosial ini telah menjadi platform bagi para pengguna untuk mengekspresikan pandangan, suasana hati, dan emosi mereka serta berbagi dengan keluarga, teman, dan orang-orang terkait lainnya. Perilaku memposting dan berbagi konten di media sosial mencerminkan kehidupan sehari-hari dan kondisi mental pengguna. Dalam beberapa dekade terakhir, para peneliti telah banyak menggunakan media sosial untuk mendeteksi kesehatan mental pengguna [10]–[12] dan berbagai aplikasi lainnya [13]–[16].dan lain-lain.[17] melakukan studi pengguna berbasis wawancara dan kuesioner untuk menganalisis perilaku dan pola bahasa pengguna yang mengalami depresi di Twitter.
Metode berbasis wawancara ini mahal dan memakan waktu. Selain itu, sering kali sulit untuk mendapatkan data yang cukup dengan cara ini untuk menjamin ketahanan dan karakter umum model. Kuesioner wawancara ini didasarkan pada perilaku depresi, sebagaimana ditetapkan dalam penelitian terkait sebelumnya [18]. Gejala depresi juga berkembang seiring kemajuan teknologi, terutama setelah munculnya media sosial daring. Gejala yang berkembang ini mungkin tidak selalu tercakup sepenuhnya dalam literatur depresi sebelumnya. Untuk menjembatani kesenjangan tersebut, beberapa penelitian [19], [20] baru-baru ini menganalisis model berbasis perilaku media sosial untuk mendeteksi depresi. Mereka mengumpulkan kumpulan data depresi berbasis Twitter dan mengembangkan metode untuk memanfaatkan informasi depresi lintas domain. Namun, menurut literatur yang ada [18], [21], depresi adalah gangguan yang mungkin ada pada orang-orang pada tingkat atau intensitas yang berbeda. Pada tahap awal, intensitas ini umumnya rendah dan tingkat keparahannya didorong oleh situasi yang dialami dari waktu ke waktu. Orang yang terkena umumnya memerlukan perawatan sesuai dengan tingkat keparahan depresi. Oleh karena itu, hanya mendeteksi depresi pada seseorang tidak selalu membantu untuk merekomendasikan perawatan yang tepat oleh seorang ahli di bidang tersebut. Sebaliknya, sangat penting untuk menentukan tingkat keparahan depresi agar dapat memahami kasusnya dengan baik, seperti yang diilustrasikan
1) Kami menyajikan tinjauan pustaka yang komprehensif tentang domain interdisipliner kesehatan mental dan penambangan media sosial untuk deteksi depresi.
2) Kami mengembangkan teknik pelabelan semisupervised padat, untuk memberi label ulang pada data Twitter yang berlabel jarang, dengan intensitas depresi.
3) Kami mengusulkan suatu metode, yang terdiri dari ekstraksi lima jenis fitur relevan yang berbeda untuk setiap pengguna dari data media sosial mereka dan melatih jaringan LSTM, untuk memprediksi intensitas depresi pengguna.
4) Kami melakukan eksperimen ekstensif untuk menetapkan kemanjuran metode yang diusulkan. Kami mengungguli model lain yang sebanding untuk estimasi intensitas dan juga mengungguli metode yang ada untuk klasifikasi biner.
D. Organisasi Kertas
Sisa artikel ini disusun sebagai berikut. Bagian II menyediakan literatur yang komprehensif, diikuti oleh beberapa konsep dasar dan pernyataan masalah di Bagian III. Kami menyajikan metode yang diusulkan di Bagian IV dan hasil eksperimen di Bagian V. Akhirnya, kami menyimpulkan artikel ini di Bagian VI.
II. L
ITERATURR
ULASANDeteksi depresi dari data sosial merupakan domain
interdisipliner depresi, kesehatan mental, dan sosial.
penambangan media. Di bagian ini, kami membahas literatur yang ada dan kemajuan terkini dalam pendeteksian depresi, mulai dari metode tradisional di era awal hingga saat ini dengan
memanfaatkan data media sosial.
membantu mereka untuk mendapatkan kelegaan dari stres mereka melalui mikroblog. Sebuah karya terbaru oleh Xu dan Zhang [30]
mencoba menjelaskan bagaimana pengguna media sosial
mengungkapkan suasana hati mereka dari perspektif analisis depresi.
Dalam karya terbaru lainnya, Shendan lain-lain.[19] menyusun kumpulan data depresi berlabel baik yang memiliki label depresi dan nondepresi di Twitter. Mereka mengekstrak enam kelompok fitur terkait depresi, yang mencakup kriteria depresi klinis dan perilaku daring di media sosial. Untuk mencapai tugas yang disebutkan di atas, mereka mengusulkan model pembelajaran kamus depresi multimoda yang mendeteksi pengguna yang depresi di Twitter. Shendan lain-lain.[
20] lebih lanjut mempelajari masalah menarik tentang pemindahan label depresi dari domain sumber ke domain target. Pekerjaan mereka dipindahkan dari Twitter sebagai domain sumber ke Weibo sebagai domain target. Sadequedan lain-lain.[31] baru-baru ini melakukan penelitian untuk mengukur latensi deteksi depresi dari media sosial.
Penelitian ini mengukur seberapa akurat model dapat memprediksi depresi dari data Reddit dalam hal kesalahan deteksi risiko dini (ERDE), metode berbasis jendela risiko, dan latensi. Dari literatur di atas, jelas bahwa seseorang dapat menggunakan pola perilaku media sosial untuk analisis depresi. Demikian pula, Trotzekdan lain-lain.[32]
mengusulkan metode berbasis pembelajaran mendalam untuk deteksi dini depresi di platform media sosial. Mereka mengevaluasi berbagai penempatan kata melalui CNN dan membandingkan hasilnya dengan klasifikasi berbasis metadata linguistik tingkat pengguna. Ada beberapa karya tentang identifikasi komunitas yang berpengaruh dan pemaksimalan pengaruh [33]–[35]. Karya-karya tersebut dapat membantu menganalisis peran komunitas dalam penyebaran depresi di seluruh jaringan sosial.
A. Deteksi Depresi Tradisional
Menyadari keseriusan masalah depresi, penelitiannya dimulai jauh sebelum era internet [18], [22]. Penelitian ini sebagian besar didasarkan pada survei kuesioner yang bergantung pada pengguna.inventaris depresidari Beckdan lain-lain.[18] terdiri dari 21 pertanyaan, yang terutama menilai kondisi mental pengguna.
Demikian pula, Skala CES-D [22] juga didasarkan pada 20 pertanyaan. Pertanyaan-pertanyaan ini terutama pada kondisi mental, seperti perasaan bersalah dan pola tidur pengguna.
Kuesioner tersebut memiliki pertanyaan tipe pilihan ganda dengan skor variabel atau meminta umpan balik pengguna beserta tingkat situasi mereka. Tingkat depresi didiagnosis lebih lanjut
berdasarkan skor total. Untuk lebih jauh mendeteksi depresi, estimasi intensitasnya juga telah dipelajari sejak lama. Beck Depression Index-II (BDI-II) [21] adalah standar dalam "rentang luas," yang memetakan skor depresi berbasis kuesioner ke dalam kategori berikut: 1) 0–13: menunjukkan tidak ada atau depresi minimal; 2) 14–19: menunjukkan depresi ringan; 3) 20–28:
menunjukkan depresi sedang; dan 4) 29–63: menunjukkan depresi berat. Sebaliknya, Whooley dan Owen [23] mengemukakan sembilan jenis indikator depresi sebagai kriteria standar untuk diagnosis depresi dalam manual diagnostik dan statistik gangguan mental (DSM). Psikolog klinis umumnya mengikuti metode ini untuk mendiagnosis depresi selama kurun waktu tertentu sebelum keputusan akhir. Metode-metode ini diterapkan pada kasus-kasus depresi di dunia nyata selama beberapa tahun. Yang juga perlu dicatat adalah bahwa DSM terus berkembang seiring waktu. DSM telah berkembang dari versi DSM-IV ke versi DSM-V (2013) dalam kurun waktu 12 tahun, di mana perilaku dan gejala berbasis media sosial baru mungkin belum disertakan.
C. Analisis Kesehatan Mental yang Dipicu Peristiwa
Orang terkadang terpengaruh secara mental karena beberapa pengalaman negatif dalam kehidupan nyata mereka. Peristiwa tersebut bertindak sebagai pemicu masalah mental, yang selanjutnya mengarah pada depresi. Mirip dengan masalah deteksi peristiwa pada umumnya,deteksi acara pribadidari data media sosial juga menjadi arah penelitian yang menarik. Li dan Cardie [36]
mengumpulkan peristiwa kehidupan pengguna berdasarkan profil Twitter mereka. Selanjutnya, mereka mengusulkan kerangka kerja tanpa pengawasan untuk membuat daftar peristiwa pribadi. Demikian pula, dalam karya lain, Lidan lain-lain.[37] melatih pengklasifikasi terbimbing yang mengambil fitur tekstual yang ditetapkan secara manual sebagai input. Fitur-fitur ini mengklasifikasikan tweet pengguna ke dalam kategori peristiwa kehidupan yang telah ditetapkan sebelumnya. Beberapa karya berfokus pada stres yang ditimbulkan di media sosial. Lindan lain-lain.[11] berupaya mengidentifikasi subjek atau peristiwa yang memicu stres. Berdasarkan hipotesis ini, mereka mengumpulkan kumpulan data dari Twitter dan melabelinya dengan tepat berdasarkan peristiwa stres.
B. Media Sosial dan Deteksi Depresi
Seiring dengan semakin diterimanya media sosial sebagai platform untuk mengekspresikan jati diri, para peneliti baru-baru ini mulai memanfaatkan data yang dihasilkan pengguna pada platform tersebut untuk mendeteksi depresi dan perawatan kesehatan mental. Parkdan lain-lain.[17] pertama kali menganalisis bahasa yang digunakan di Twitter untuk mengekspresikan suasana hati depresif. Mereka selanjutnya menyelidiki [24] sikap dan perilaku depresif pengguna Twitter. Untuk penelitian mereka, mereka melakukan wawancara tatap muka dan mengukur korelasi antara wawancara tersebut dan data Twitter. De Choudhurydan lain-lain.[25] juga meneliti data media sosial untuk prediksi “gangguan depresi mayor”.
Mereka memanfaatkan beberapa pola perilaku pengguna yang mengalami depresi dari data ini dan menghubungkannya dengan studi psikologis.
Resnikdan lain-lain.[26] mempelajari model topik untuk menganalisis pola sinyal linguistik yang sesuai dengan keterlibatan sosial, kontrol ego yang buruk, hubungan, tekanan emosional, dan sebagainya untuk prediksi depresi. Demikian pula, Tsugawadan lain-lain.[27] lebih lanjut menyelidiki perilaku posting Twitter untuk memprediksi depresi bagi pengguna berbahasa Jepang. Xuedan lain-lain.[28], [29] mengusulkan model untuk deteksi stres menggunakan data media sosial. Mereka pertama kali mendeteksi tekanan psikologis melalui analisis tweet remaja. Selanjutnya, mereka
D. Emosi dari Teks Sosial
Emosi berhubungan erat dengan depresi dan kesehatan mental.
[38]. Tren media sosial memberikan peluang yang baik untuk menilai emosi pengguna dari data tekstual mereka. Pengguna sering berbagi sejumlah besar posting dan tweet, yang menggambarkan keadaan emosional mereka saat ini. Untuk menafsirkan makna sintaksis dan semantik dari posting tekstual tertentu, data diubah ke format vektor dan ditambang. Ada berbagai metode untuk membuat representasi ini.
Berbasis kata kunci atau leksikon
Metode menggunakan kamus yang telah ditetapkan sebelumnya yang berisi label efektif yang sesuai dengan setiap kata kunci tertentu [39], [40]. Label mengikuti model dimensional atau kategorikal. Kamus dibuat secara manual atau otomatis, yang memerlukan pengetahuan domain linguistik. Selain itu, anotasi dapat terpengaruh oleh ambiguitas kata-kata dan konteks yang terkait dengannya. Ukuran statistik, seperti frekuensi, sekumpulan kata, dan kesamaan kosinus, umumnya digunakan untuk
mendapatkan penyematan vektor kata kunci. Kategori emosi juga dapat diprediksi dengan menggunakan metode berbasis
pembelajaran. Model atau pengklasifikasi mengambil data teks yang disematkan sebagai input. Input dapat diberikan secara segmental atau dengan cara jendela geser, dan output adalah probabilitas emosi yang sesuai. Ghoshdan lain-lain.[41]
mengusulkan Model Bahasa Afek berbasis LSTM-RNN untuk ekstraksi fitur afektif dengan menggunakan kerangka kerja analisis teks Linguistic Inquiry dan Word Count [42]. Dalam beberapa metode yang disebutkan di bagian sebelumnya, teks masukan diubah menjadi format vektor dalam ruang laten sehingga dua kata yang secara semantik dekat tetap dekat dalam ruang laten.
Metode ini disebut penyisipan kata.Kata2Vec[43] adalah contoh model semacam itu, yang digunakan untuk membuat penyisipan kata dari teks. Penyematan ini diketahui dapat menangkap informasi semantik tingkat rendah serta informasi kontekstual yang ada dalam data. Word2Vec terutama menggunakan salah satu dari dua arsitektur model—continuous bag-of-words (CBOW) ataulompat-gram terus menerus, untuk menghasilkan
representasi kata. Dalam arsitektur CBOW, model memprediksi kata saat ini dari kata kontekstual di sekitarnya. Urutan kata kontekstual umumnya tidak memengaruhi prediksi, yang serupa dengan pendekatan bag-of-words. Sedangkan dalam arsitektur skip-gram berkelanjutan, model melakukan hal yang sebaliknya dari CBOW. Model menggunakan kata saat ini untuk memprediksi kata kontekstual di sekitarnya. Arsitektur skip-gram memberikan bobot lebih besar pada kata kontekstual di dekatnya daripada yang jauh. Secara praktis, CBOW lebih cepat daripada skip-gram. Dalam kasus kata yang jarang muncul, model skip-gram berkinerja lebih baik daripada CBOW. Baru-baru ini, Asghardan lain-lain.[44]
menggunakan ruang efektif 3-D untuk mencapai hal yang sama.
Penanaman kata merepresentasikan data teks dalam ruang laten berdimensi tinggi. Teknik, seperti LSA, LSA probabilistik, atau faktorisasi matriks nonnegatif, dapat diterapkan untuk memperoleh representasi data teks yang ringkas.
Gbr. 2.
(b) Kata kunci yang mirip dengan depresi di LSI.
(a) Posisidepresidalam model Russel's Circumplex [3].
sedang diselidiki. Sejauh pengetahuan kami, artikel ini merupakan studi pertama tentang estimasi intensitas depresi dari data media sosial.
III. Hal.Makanan Reliminari
Pada bagian ini, kami membahas beberapa konsep mendasar tentang depresi, diikuti dengan pernyataan masalah.
A. Apa itu Depresi?
Menurut American Psychiatric Association (APA) [45], depresi adalah gangguan depresi mayor dan penyakit medis serius yang berdampak negatif pada perasaan, kemampuan berpikir, dan perilaku kita. Depresi terutama menimbulkan perasaan sedih, disertai hilangnya minat dalam aktivitas apa pun. Karena menyebabkan berbagai masalah emosional dan fisik, depresi cenderung menghambat kemampuan normal seseorang untuk berfungsi di tempat kerja dan/atau di rumah. Beberapa gejala umum yang umumnya dialami oleh pasien depresi dengan intensitas ringan hingga berat, menurut APA [45], adalah - (i) merasa sedih atau memiliki suasana hati tertekan; (ii) kehilangan minat atau kesenangan dalam beraktivitas; (iii) perubahan nafsu makan yang menyebabkan penurunan atau penambahan berat badan (sama sekali tidak terkait dengan diet); (iv) pola tidur yang terganggu, kelelahan, dan kehilangan energi; (v) gerakan dan ucapan melambat (tindakan yang dapat diamati oleh orang lain) dan merasa kesepian; (vi) merasa tidak berharga atau bersalah; (vii) merasa kesulitan dalam berpikir, berkonsentrasi, atau membuat keputusan; (viii) pikiran tentang kematian atau bunuh diri. Untungnya, depresi dapat diobati.
Seorang pasien yang mengalami gejala-gejala yang disebutkan di atas selama dua minggu atau lebih harus menjalani diagnosis depresi.
Depresi adalah kondisi emosional dalam model emosi Circumplex Russel [3], yang berhubungan dengan valensi negatif dan gairah rendah. Kondisi ini melibatkan mati rasa emosi, terutama kesedihan, ketakutan, kemarahan, rasa malu, dan sebagainya. Ketika emosi ini berulang kembali pada dirinya sendiri, terkadang hal itu bisa menjadi menyakitkan hingga melampaui batas apa pun. Dengan hipotesis ini, memproyeksikan teks linimasa Twitter pengguna ke dalam ruang Valance-Arousal dan memberi label ulang data berdasarkan analisis intensitas depresi akan membantu dalam pemahaman yang lebih baik tentang tingkat depresi. Gambar 2 menunjukkan posisi kata “tertekan,”
diplot pada bidang ini.
E. Status dan Keterbatasan Saat Ini
Semua deteksi depresi dan metode analisis kesehatan mental yang disebutkan di atas mengonfirmasi kekayaan dan potensi data media sosial untuk mengidentifikasi pengguna yang depresi dan stres secara efektif. Upaya ini secara signifikan membawa kita maju ke arah perawatan kesehatan mental. Namun, semua metode yang dibahas terutama berfokus pada klasifikasi biner pengguna, yang memprediksi apakah pengguna mengalami depresi atau tidak. Penelitian tentang estimasi intensitas depresi masih belum banyak mendapat perhatian. Mengingat fakta bahwa perawatan orang yang depresi secara signifikan bergantung pada tingkat depresi, estimasi intensitas merupakan masalah penting dalam arah ini dan layak
B. Pernyataan Masalah
Dalam sebuah platform media sosial, katakanlah, kita memilikiNpengguna dan data media sosial merekaDPermasalahan yang dibahas bertujuan
untuk memperkirakan intensitas depresi setiap pengguna pada skala [0-1] yang dapat dengan mudah dipetakan ke tingkat depresi. Kami menggunakan BDI-II [21], di mana skala [0-1] yang sesuai dibagi lagi menjadi beberapa rentang seperti tidak ada atau depresi minimal (0 berarti tidak ada depresi), depresi ringan, depresi sedang, dan depresi berat (1 berarti depresi paling parah).
IV.Halaman belakangDITUTUPKANMETOD
Gbr. 3. Alur keseluruhan metode yang diusulkan.
Masalah memperkirakan intensitas depresi seseorang merupakan tantangan, terutama karena sifat data media sosial yang tidak teratur dan tidak terstruktur. Berikut ini adalah beberapa tantangan utamanya.
Dengan cara ini, kumpulan data nondepresi juga dibuat. Karena kumpulan data diberi label secara jarang ke dalam kelas biner depresi dan nondepresi, label ini tidak secara langsung berguna untuk estimasi intensitas depresi.
Oleh karena itu, kami mengembangkan teknik pelabelan ulang kami sendiri untuk kumpulan data yang sama. Pertama, kami menghitung skor depresi berdasarkan polaritas emosi tweet dan LSA, seperti yang dijelaskan di bawah ini. Skor tersebut kemudian dipetakan ke dalam empat kategori intensitas.1
C.1Tidak ada kumpulan data patokan skala besar yang tersedia untuk umum untuk analisis intensitas depresi.
C.2Perilaku pengguna di media sosial bersifat heterogen. Sulit untuk mengkarakterisasi pengguna dari perspektif diskriminatif dan menangkap hubungan di berbagai modalitas.
C.3Meskipun perilaku pengguna beragam dan beragam, hanya sedikit yang merupakan gejala depresi. Hal ini membuat ciri-ciri yang berorientasi pada depresi jarang terlihat di media sosial dan sulit untuk dideteksi.
1) Polaritas Emosi:Kami menggunakan pustaka NLTK2untuk melihat polaritas gabungan dari tweet dan menetapkan skor polaritas emosi dalam skala [−1,1] untuk setiap pengguna berdasarkan tweet mereka.
NLTK terutama menggunakan keluaran algoritma Valence Aware Dictionary dan sEntiment Reasoner (VADER) untuk skor sentimen yang memiliki empat kelas sentimen (yaitu, neg: Negatif, neu: Netral, pos:
Positif, dan gabungan: Gabungan). Di sini, gabungan adalah skor agregat, yang merupakan skor yang dinormalisasi dalam rentang [
−1,1], yang diperkirakan dengan nilai harapan maksimum. Saat kita memberi label intensitas depresi, kita menganggap polaritas negatif sebagai nilai positif (skor keseluruhan yang lebih tinggi) dan sebaliknya.
2) LSA:Kami mengekstrak semua kata kunci yang terkait dengan kata kunci depresi dalam grafik indeks semantik laten (LSI).3Ini adalah metode pengindeksan yang menggunakan teknik singular value decomposition (SVD) untuk mengidentifikasi pola dalam dokumen teks. LSI terutama didasarkan pada prinsip bahwa kata-kata yang digunakan dalam konteks yang sama cenderung memiliki makna semantik yang sama. Ini dapat menghubungkan istilah-istilah yang terkait secara semantik. Tabel I menunjukkan kata kunci LSI yang luas dan sempit yang terkait dengan
"depresi" dan Gambar 2 memvisualisasikan kata kunci yang terkait erat.
Kata-kata yang lebih umum abstrak dari kata kunci yang diberikan disebut istilah papan dan yang lebih spesifik disebut istilah sempit. Dengan menggunakan kata kunci yang diekstraksi, kami menghitungskor semantik untuk setiap pengguna menggunakan yang berikut (1), dengan mengambil jumlah tertimbang dari skor hit istilah luas yang dinormalisasih(b)dan skor hit jangka sempit yang dinormalisasih(n), untuk membuat rentangnya dalam skala [0,1].h(b)Danh(n)adalah jumlah normalisasi hit dari istilah umum dan istilah khusus (berkaitan dengan depresi dalam grafik LSI), masing-masing, dengan tweet pengguna. Bobot yang lebih besar dapat diberikan pada istilah umum dan bobot yang lebih kecil pada istilah khusus
Untuk mengembangkan metode kami, kami perlu mengatasi tantangan- tantangan yang disebutkan di atas. Kami mengatasiC.1dengan
mengembangkan teknik pelabelan padat di Bagian IV-A, untuk memberi label ulang pada kumpulan data berlabel jarang yang ada, dengan intensitas depresi. Kami membahasC.2DanC.3dengan mengembangkan metode berbasis pembelajaran mendalam di Bagian IV-B–IV-D, di mana kami melakukan praproses data sosial, mengekstrak serangkaian fitur yang kaya, dan melatih jaringan LSTM untuk memprediksi intensitas depresi.C.2diatasi dengan mendefinisikan fitur-fitur kami yang sesuai dengan pengguna, yang membuat metode ini independen dari sifat heterogen mereka.C.3ditangani dengan mempertimbangkan serangkaian fitur yang kaya yang memilikitidak langsung hubungan dengan depresi. Gambar 3 menunjukkan alur kerja keseluruhan dari metode yang diusulkan. Dimulai dengan praproses dataset dan pelabelan ulang ke berbagai tingkat depresi dengan menghitung skor depresi untuk setiap pengguna. Kemudian serangkaian fitur yang kaya diekstraksi dan jaringan LSTM dilatih untuk memprediksi intensitas depresi akhir pengguna.
A. Deskripsi dan Pelabelan Ulang Dataset
Kami menggunakan dataset yang dikurasi oleh Shendan lain-lain.[19], yang terdiri dari total 6562 pengguna, yang mana 1402 diantaranya berlabel tertekandan 5160 sebagaitidak depresidan total 4 245 747 tweet, yang mana 292 564 adalah pengguna yang depresi dan 3 953 183 adalah pengguna yang tidak depresi. Mereka mengumpulkan set data ini melalui perayapan web informasi profil pengguna Twitter bersama dengan linimasa mereka.
Mereka juga mencari tweet jangkar yang menggambarkan kondisi mental pengguna. Semua tweet yang dipublikasikan dalam durasi satu bulan dari tweet jangkar dikumpulkan. Mereka memberi label pengguna sebagai depresi jika tweet jangkar mereka memenuhi ekspresi reguler berikut
"(Saya/Saya dulu/Saya/Saya telah) didiagnosis depresi." Dengan demikian, mereka memperoleh 1402 pengguna yang depresi dan 2 92 564 tweet dalam satu bulan. Demikian pula, pengguna yang tidak memposting tweet apa pun yang memiliki kata "depresi," diberi label sebagai tidak depresi.
Skor semantik =sebuahBahasa Indonesia:h(b)+(1 −sebuah)Bahasa Indonesia:bahasa inggris: h(n).
(1)
1Angka ini dapat diubah tergantung pada persyaratan aplikasi. Untuk penelitian kami, kami tetap menggunakan angka empat.
2http://www.nltk.org/howto/sentiment.html
3https://www.twinword.com/ideas/graph/depression/
TABEL I
BJALAN DANNANAK PANAHTERMSCATAUMENANGGAPIBahasa Inggris: KKATA KUNCI"DEPRESI" "
3) Skor Depresi:Kami menghitung skor depresi akhir dengan menambahkan polaritas emosi dan skor semantik pengguna bersama- sama dan mengambil nilai normalisasi min-maks, seperti yang ditunjukkan pada (2), di mana min dan maks adalah nilai minimum dan maksimum dari penjumlahan skor polaritas dan semantik. Dengan cara ini skor depresi pengguna berada dalam kisaran
3) Fitur valence arousal dominant (VAD) [50] yang sesuai dengan tweet (3-D). Pada dasarnya, emosi diukur dalam bidang 3-D yang disebut valance, arousal, dan dominant. Valance merepresentasikan efek negatif terhadap positif dari emosi.
Arousal merepresentasikan intensitas emosi. Dominance merepresentasikan kontrol terhadap stimulus emosional.
[0-1]
( skor polaritas + skor semantik ) -menit
2) Fitur Topik/Acara:Kami juga mempertimbangkan kejadian yang memicu depresi. Untuk analisis topik, kami menggunakan Dirich laten(2) teknik alokasi let (LDA) [51]. Kami mengekstrak fitur topik 25-D
dalam hal ini.
3) Fitur Perilaku Online:Perilaku daring pengguna ditangkap oleh fitur-fitur berikut.
Skor depresi = .
maks − min
B. Praproses Data
Kami melakukan praproses data menggunakan kotak alat NLTK4[46]
dan menggabungkan tweet pengguna untuk ekstraksi fitur. Langkah praproses kami mencakup tugas-tugas berikut. Kami menghapus Emoji dalam teks Tweet karena Emoji tidak kompatibel dengan banyak algoritma pemrosesan teks. Semua tanda baca, artikel, dan karakter khusus dihapus. Sebelum pemrosesan apa pun, kami membuat token pada kalimat-kalimat tersebut. Kami menggunakan Porter Stemmer [47] untuk membuat stem tweet dan WordNet Lemmatiser [48] untuk membuat lemmatisasinya. Kami juga memproses kata-kata tidak beraturan yang umumnya disebutkan di media sosial. Ini mungkin kesalahan tipografi atau singkatan dari kata-kata umum. Mirip dengan [19], kami memanfaatkan model word2vec [49] yang dilatih pada data Twitter untuk tugas ini.
1) Jumlah tweet (ini adalah vektor 2-D yang mencakup nilai tingkat pengguna dan dalam rentang waktu).
2) Interaksi sosial (ini adalah vektor 1-D yang mencakup sejumlah retweet/komentar per tweet. Kami menjumlahkan nilai per tweet.)
3) Perilaku posting (ini adalah vektor 2-D yang mencakup sejumlah tweet per jam dan rasio tweet per hari terhadap jumlah total tweet).
4) Fitur Tingkat Pengguna:Kami menggunakan atribut pengguna berikut: "id," "id str," "nama," "nama layar," "lokasi," "lokasi profil,"
"deskripsi," "url," "entitas," "dilindungi," "jumlah pengikut," "jumlah teman," "jumlah yang tercantum," "dibuat pada," "jumlah favorit,"
"offset utc," "zona waktu," "diaktifkan secara geografis," "diverifikasi,"
"jumlah status," "bahasa," "status," "kontributor diaktifkan," "adalah penerjemah," "apakah terjemahan diaktifkan," "warna latar belakang profil," "url gambar latar belakang profil," "url gambar latar belakang profil https," "ubin latar belakang profil," "url gambar profil," "url gambar profil https," "url spanduk profil," "warna tautan profil," "warna batas bilah sisi profil," "warna isian bilah sisi profil," "warna teks profil,"
"gambar latar belakang penggunaan profil," "profil telah diperluas,"
"profil default," "gambar profil default," "mengikuti," "permintaan mengikuti terkirim," "notifikasi," "jenis penerjemah," dll. Di antara atribut-atribut ini, kami melakukan pemrosesan berikut. Tanggal, url, dan id dihapus. Atribut yang memiliki nilai benar/salah diubah menjadi 0/1. Untuk atribut yang memiliki nilai unik, kami memperoleh set unik tersebut. Kami memberikan bobot frekuensi pada atribut ini. Misalnya,
"zona waktu". Untuk atribut teks seperti "status", kami mengekstraksi embedding word2vec yang sesuai dengannya. Untuk atribut lainnya yang memiliki nilai integer, kami menormalkan kolom melalui normalisasi min–maks. Akhirnya, kami memperoleh vektor 334-D yang sesuai dengan fitur tingkat pengguna.
5) n-Gram Terkait Depresi:Kami mengekstrakN-gram yang terkait dengan kata kunci depresi dan penyematannya sebagai C. Ekstraksi Fitur
Kami bertujuan untuk mendeteksi dan menganalisis pengguna yang mengalami depresi dari perilaku daring mereka. Dalam kasus perilaku luring, terdapat definisi yang menonjol dalam kriteria depresi klinis, yang banyak digunakan dalam diagnosis depresi. Demikian pula, kami mengekstrak beberapa perilaku daring umum pengguna media sosial.
Dari literatur, terbukti bahwa emosi, peristiwa, perilaku daring, fitur khusus pengguna, dan penggunaan teks terkait depresi, relevan dengan estimasi intensitas depresi. Kami mempertimbangkan fitur- fitur berikut untuk menggambarkan setiap pengguna.
1) Fitur Emosional:Kami mempertimbangkan fitur terkait emosi 12-D, sebagaimana didefinisikan berikut ini.
1) Penghitungan kata negatif satu dimensi dalam tweet dengan bantuan LIWC [42].
2) Fitur emosi baik pada tingkat kalimat (4-D) dan tingkat kata (4-D).
54https://www.datacamp.com/community/tutorials/stemming- lemmatizationpython
5http://www.nltk.org/howto/sentiment.html
fitur. Kami telah menggunakan kata kunci “depresi,” “kecemasan,” “stres,”
“tidak bahagia,” dan “sedih” untuk mengekstrakN-gram. Untuk
menyederhanakannya, kami hanya mempertimbangkan unigram, bigram, dan trigram. Kami mengekstrak dua fitur berikut dalam kategori ini.
TABEL II
DNN, GRUDANLSTM SebuahArsitektur
1) Kita hitung jumlahnyaN-gram (fitur 1-D).
2) Kami mengekstrak 150-D word2vec embedding dari iniN-gram dan menggunakannya sebagai fitur.
6) Fitur Keseluruhan:Jadi secara keseluruhan, kita memiliki 527 [12 (emosi) + 25 (tingkat topik) + 5 (perilaku online) + 334 (tingkat pengguna) + 151 (berhubungan dengan depresiN-gram)]-dimensi vektor fitur yang sesuai dengan setiap pengguna, sebagai masukan ke jaringan.
simpul tersembunyi. Simpul tersembunyi dipolakan pada neuron yang sesuai dengan otak manusia, yang aktif saat menghadapi rangsangan yang cukup. Simpul ini mengambil masukan dari data dengan serangkaian bobot yang menentukan signifikansi masukan yang diberikan. Produk bobot masukan ini dijumlahkan dan dilewatkan melalui fungsi aktivasi.
GRU:Jaringan saraf perlu mengingat pola yang relevan dari data.
Kelemahan utama DNN adalah tidak dapat mengingat status masa lalu, terutama untuk data temporal. Jaringan saraf berulang mengatasi masalah ini. RNN memiliki loop di dalamnya yang memungkinkan informasi apa pun tetap ada. GRU menggunakan gerbang pembaruan dan gerbang pengaturan ulang untuk mengingat/melupakan status sebelumnya. Ini adalah dua vektor yang menentukan informasi apa yang akan diteruskan ke output.
Bahasa Inggris MDL:MDL, diusulkan oleh Shendan lain-lain.[19], didasarkan pada fitur enam kelompok terkait depresi, yang mencakup kriteria depresi klinis dan perilaku daring di media sosial. Model pembelajaran kamus depresif multimodal mereka menganggap masalah tersebut sebagai tugas klasifikasi biner dan mengidentifikasi apakah pengguna mengalami depresi atau tidak. Sebaliknya, pekerjaan kami memprediksi intensitas depresi pengguna, yang membuat perbandingan langsung menjadi sulit. Oleh karena itu, kami membandingkan dengan MDL dalam dua cara berbeda. Pertama, MDL diadaptasi dengan teknik pelabelan kami untuk estimasi intensitas depresi dan dibandingkan dengan metode yang kami usulkan, kemudian metode kami diadaptasi untuk klasifikasi biner dan dibandingkan dengan MDL.
D. Model Pembelajaran yang Diusulkan
Kami mengadopsi jaringan LSTM [52], yang mampu mempelajari ketergantungan jangka panjang. Kami mengembangkan arsitektur tiga lapis dalam metode yang diusulkan, seperti yang ditunjukkan pada Gambar 3. Rincian arsitektur jaringan ditunjukkan pada Tabel II dan dibahas kemudian.
Kami menggunakan Swish [53] sebagai fungsi aktivasi, bukan ReLU, yang didefinisikan sebagaicontoh soal f(x)=X .sigmoid(X). Beberapa propertinya (seperti tak terbatas di atas dan terbatas di bawah) mirip dengan ReLU dan beberapa (seperti halus dan nonmonotonik) berbeda. Terbatas di bawah menyebabkan regularisasi dan tak terbatas di atas mempercepat proses pelatihan karena tidak mencapai gradien mendekati nol. Keuntungan utama Swish terletak pada properti gating- nya sendiri, yaitu, ia hanya mengambil satu nilai skalar alih-alih beberapa input gating. Singkatnya, ia termasuk di antara ReLU dan wilayah aktivasi linier. Sebagai hasilnya, ia memiliki poin positif dari aktivasi linier dan ReLU. Mempertimbangkan variasi dalam Swish [54]
yangcontoh soal f(x)=2X .sigmoid(βBahasa Indonesia:X), Di mana sebuahadalah parameter yang dapat dipelajari. Dapat juga diamati bahwa, jikasebuah= 0 bagian sisanya menjadi 1/2 yaitucontoh soal f(x) menjadi linier. Demikian pula, jikasebuahsangat tinggi, bagian sigmoid berperilaku seperti aktivasi biner (0 untuk< halaman web0 dan 1 untuk>
Lainnya0). Oleh karena itu, fungsi aktivasi swish (sebuah=1) menggabungkan transisi halus antara dua ekstrem ini.
V.E. Bahasa IndonesiaPERCOBAAN B. Pengaturan Eksperimen
Kami melakukan eksperimen ekstensif dan mengevaluasi kinerja metode kami dengan beberapa cara. Pertama, kami membandingkan hasil kami dengan model estimasi intensitas dasar [support vector machine (SVM), deep neural network (DNN), dan gated recurrent unit (GRU)], lalu membandingkannya dengan multimodal dictionary learning (MDL) dengan dua cara berbeda, seperti yang dijelaskan secara rinci di bawah ini. Dalam kedua kasus, kami mengungguli yang lain. Kami juga mengevaluasi efektivitas teknik pelabelan ulang kami dan mencapai akurasi yang baik.
Kami melatih metode pembelajaran dengan pengaturan berikut.
Untuk melatih SVM, kami menggunakan SVM berbasis kernel Gaussian.
Untuk melatih DNN, GRU, dan LSTM, kami menggunakan pengoptimal SGD dengan entropi silang sebagai fungsi kerugian yang memiliki laju pembelajaran 0,01 dengan momentum 0,9. Rincian jaringan tiga lapis diberikan dalam Tabel II. Semua eksperimen kami dilakukan pada prosesor Intel Core i7 yang memiliki frekuensi CPU 4,20 GHz dan RAM 32 GB. Selama pelatihan, kami menggunakan GPU Titan XP.
C. Metrik Evaluasi
A. Metode Perbandingan Kami mengevaluasi kinerja berbagai model untuk estimasi intensitas depresi dalam hal mean squared error (MSE), yang mengukur rata-rata kuadrat kesalahan. Untuk mengevaluasi kinerja klasifikasi biner, ketepatan dalam bentuk persentase digunakan sebagai metrik evaluasi. Kami melakukan validasi silang lima kali lipat untuk pengujian dan mengambil rata-rata dari lima kali lipat tersebut.
SVM:Kami menggunakan regresor SVM, yang belajar berdasarkan teknik hyperplane pemisah. Dengan data pelatihan berlabel, algoritme menghasilkan hyperplane optimal yang mampu menangkap distribusi data.
DNN:Kami menggunakan DNN dangkal untuk memprediksi
intensitas depresi sebagai dasar lainnya. Lapisan DNN dibuat
TABEL III
RHASIL DARIDEPRESISAYAINTENSITASBahasa InggrisSTIMASIKamiITHSVM, DNN, GRUDANLSTM
TABEL IV
PKINERJACKOMPARASITKamiITHMDL [19]: %MMENYELAMATKANBBahasa IndonesiaCLASIFIKASIAKEAKURATAN DAN MSE MMENYELAMATKANSAYAINTENSITASPREDIKSIBahasa InggrisRROR
TABEL V
AKEAKURATANRPENCANTUMAN ALAMAT(TP: TMENYESALIPOSITIFBahasa Indonesia:
TN: TMENYESALINEGATIVE (yang setara))
D. Hasil Estimasi Intensitas Depresi
Hasil kuantitatif dari metode kami ditunjukkan pada Tabel III. Amati bahwa model yang diusulkan termasuk set fitur lengkap yang dilatih pada jaringan LSTM mengungguli model dasar lainnya, mencapai MSE terendah sebesar 1,42. Dengan menggunakan fungsi aktivasi swish, kinerja jaringan sedikit meningkat. Kami juga melatih model kami dengan subset fitur untuk analisis lebih lanjut. Dalam kasus prediksi tingkat fitur, fitur emosi berkinerja lebih baik dibandingkan dengan yang lain, karena depresi dan emosi saling terkait. Sebaliknya, informasi tingkat pengguna tidak memberikan informasi penting yang sesuai dengan intensitas depresi karena sifatnya yang beragam.
Karena kami telah mengeksploitasi intensitas depresi tingkat pengguna, kami menggabungkan setiap set fitur dengan fitur tingkat pengguna dan menjalankan jaringan LSTM yang serupa. Mengamati bahwa fitur "pengguna + emosi" berkinerja lebih baik daripada atribut lainnya. Kami juga membandingkan dengan MDL [19] untuk
memprediksi intensitas depresi (dalam skala [0-1]), dengan
mengadaptasi MDL dengan teknik pelabelan kami. Seperti terlihat pada Tabel IV, secara jelas, metode usulan kami yang berbasis LSTM, yang mencapai MSE sebesar 1,42, mengungguli MDL yang diadaptasi, yang mencapai MSE sebesar 1,88.
Gbr. 4.
pengguna.
Polaritas emosional pengguna. (a) Pengguna yang tidak mengalami depresi. (b) Pengguna yang mengalami depresi.
ditunjukkan pada Tabel IV. Untuk perbandingan yang adil, kami menggunakan teknik pelabelan biner [19], dengan set fitur dan model kami untuk memprediksi label depresi (yaitu, apakah pengguna mengalami depresi atau tidak). Kami mengekstrak fitur dari bobot yang dilatih untuk prediksi intensitas depresi dan menyempurnakannya untuk klasifikasi biner. Kami menyempurnakan data kami pada data depresi Twitter [19]. Kami menambahkan lapisan FC yang memiliki 128 node dengan aktivasi ReLU untuk menyempurnakan jaringan. Laju pembelajaran ditetapkan ke 0,001 dengan pengoptimal SGD. Untuk tugas ini, kami membekukan bobot jaringan yang telah dilatih sebelumnya dan menyempurnakan bagian sisanya.
F. Efektivitas Teknik Pelabelan Ulang Kami
Efektivitas teknik pelabelan kami diilustrasikan pada Tabel V.
Kami membagi skor depresi [0-1] menjadi empat kategori dan mengevaluasi statistik ini dengan membandingkannya dengan label (depresi/tidak depresi) yang sudah ditetapkan dalam kumpulan data. Kami mencapai akurasi 91,92% untuk kategori depresi berat kami dan akurasi 100% dengan menggabungkan sangat parah dan sedang-parah kategori depresi.
E. Pembelajaran Representasi
Untuk mengevaluasi lebih lanjut apakah jaringan kami mempelajari representasi umum dari fitur depresi atau tidak, kami mengadaptasi metode kami untuk klasifikasi biner, apakah pengguna mengalami depresi atau tidak dan membandingkannya dengan [19]. Kami mengungguli metode mereka dengan akurasi lebih dari 2%. Hasilnya adalah
G. Analisis Perilaku Online
Tabel VI menunjukkan beberapa contoh tweet dari pengguna yang diidentifikasi berada pada tingkat depresi yang berbeda. Mirip dengan [19], kami mengamati ciri-ciri pengguna Twitter yang mengalami depresi berikut.
TABEL VI
DEPRESISAYAINTENSITASRGEMBIRATBASAH
Penggunaan Kata Negatif:Analisis polaritas emosional dianalisis dalam Gambar 4 dalam skala [−1,1] di mana −1 berarti negatif dan +1 berarti positif. Dari gambar yang disebutkan di atas, dapat diamati bahwa sebagian besar pengguna yang tidak mengalami depresi tidak menggunakan kata- kata negatif dalam postingan. Di sisi lain, pengguna yang mengalami depresi sebagian besar menggunakan kata-kata negatif. Tiga kata negatif teratas yang paling sering digunakan adalah "depresi," "stres," dan "sedih."
Waktu Posting:Pengguna yang mengalami depresi (sekitar 53%) kebanyakan memposting tweet pada malam hari. Hal ini menunjukkan bahwa mereka cenderung mengalami insomnia. Lustberg dan Reynolds III [55] juga mempelajari bahwa gejala depresi cenderung memburuk pada malam hari. Menurut statistik mereka, hal ini dapat terjadi pada delapan dari sepuluh orang yang menderita depresi.
Gaya Bahasa:Mirip dengan pekerjaan yang dilakukan oleh masalah dalam skenario pandemi saat ini, kami berharap bahwa De Choudhurydan lain-lain.[25], kami menganalisis artikel, kata kerja bantu, konjungsi, kata keterangan, kata ganti orang, preposisi, dan negasi. Terlihat bahwa pengguna yang depresi menggunakan kata ganti orang untuk menunjukkan sifat mereka yang tertekan.
Pengaruh Atribut Lainnya:Kami juga mengamati beberapa atribut lain yang memicu depresi. Beberapa kata kunci peristiwa pribadi ("tekanan pekerjaan," "perceraian," "putus cinta," dll.) diamati dalam kronologi mereka. Mungkin ada hubungan konsekuensi peristiwa di antara mereka. Juga diamati bahwa pengguna yang depresi menganggap ini adalah platform yang nyaman untuk berbagi perasaan, mendapatkan perhatian, atau mengekspresikan keadaan emosional mereka, terutama perasaan tidak berdaya.
merancang serangkaian fitur diskriminatif terkait depresi yang kaya bagi pengguna, dan mengusulkan jaringan LSTM untuk mendeteksi pengguna yang mengalami depresi pada berbagai tingkatan di Twitter.
Kami memvalidasi kinerja metode kami dengan melakukan eksperimen ekstensif pada kumpulan data standar dan mengungguli alternatif lain untuk estimasi intensitas. Metode kami yang diadaptasi untuk
klasifikasi biner mengungguli metode klasifikasi biner yang ada dengan akurasi lebih dari 2%. Penelitian ini mengarah ke beberapa arah masa depan yang menjanjikan. Akan menarik untuk mengeksplorasi struktur jaringan sosial dan lokasi pengguna untuk mengidentifikasi
penyebaran depresi di antara komunitas sosial. Penelitian ini juga diharapkan dapat memberikan wawasan lebih jauh tentang penelitian depresi dalam komunitas komputasi afektif. Selain itu, karena depresi telah menjadi masalah yang mendesak
penelitian yang diusulkan akan mengarah pada pengembangan metode penilaian awal otomatis berdasarkan data sosial.
R
REFERENSI[1] F. Hao, G. Pang, Y. Wu, Z. Pi, L. Xia, dan G. Min, “Memberikan dukungan sosial yang tepat untuk pencegahan depresi bagi penderita yang sangat cemas,”
Sistem Sosial Trans.Komputasi IEEE, vol. 6, no. 5, hal. 879–887, Oktober 2019.
[2] (2020).Depresi[Daring]. Tersedia: https://www.who.int/newsroom/
fact-sheets/detail/depression
[3] JA Russell, “Sebuah model pengaruh sirkumpleks,”J. Kepribadian Psikologi Sosial., vol. 39, no. 6, hal. 1161, Desember 1980.
[4] (2018).India adalah Negara Paling Tertekan di Dunia[Online]. Tersedia:
https://www.indiatoday.in/education-today/gk-current-affairs/story/
india-is-the-most-depressed-country-in-the-world-mental- healthday/-2018-1360096-2018-10-10
[5] RI Shader, “COVID-19 dan depresi,”Terapi Klinis, vol. 42, no. 6, hlm.
962–963, 2020.
[6] S. Pappa, V. Ntella, T. Giannakas, VG Giannakoulis, E. Papoutsi, dan P.
Katsaounou, “Prevalensi depresi, kecemasan, dan insomnia di kalangan petugas kesehatan selama pandemi COVID-19: Tinjauan sistematis dan meta-analisis,”Otak, Perilaku, Kekebalan, jilid. 88, hlm.
901–907, Agustus 2020.
[7] J. Kanter dan K. Manbeck. (2020).Covid-19 Bisa Sebabkan Epidemi Depresi Klinis, dan Sistem Layanan Kesehatan Belum Siap Menghadapinya[Online]. Tersedia: https://theconversation.com/
covid-19- could-lead-to-an-epidemic-of-clinical-depression-and-the/- health-caresystem-isnt-ready-for-that-either-134528
[8] D. Dresden. (2020).Merawat Seseorang yang Mengalami Depresi Selama Pandemi COVID-19[Online]. Tersedia: https://
www.medicalnewstoday.com/articles/how-to-care-for-someone- withdepression
[9] C. Koons. dan (2020).Sistem Perawatan Kesehatan Mental tidaklah Siap untuk COVID-19 Baik[Online]. Tersedia: https://
www.bloomberg.com/news/articles/2020-04-01/the-us-mental-health- caresystem-isn-t-ready-for-coronavirus
[10] G. Coppersmith, M. Dredze, dan C. Harman, “Mengukur sinyal kesehatan mental di Twitter,” dalamProsiding Lokakarya Komputasi Linguistik Psikolog Klinis, Sinyal Linguistik ke Realitas Klinis, 2014, hlm. 51–60.
VI.C.Bahasa IndonesiaKESIMPULAN
Depresi merupakan masalah mendesak di masyarakat kita saat ini, yang memengaruhi lebih dari 264 juta orang di seluruh dunia dan masih terus meningkat. Depresi dapat menjadi masalah kesehatan serius jika berlangsung lebih dari dua minggu dengan intensitas sedang atau berat.
Bahkan dapat menyebabkan bunuh diri jika orang yang depresi tidak menerima perawatan yang tepat. Situasinya paling buruk di negara-negara seperti India, Tiongkok, dan AS. Selama pandemi COVID-19 yang sedang berlangsung dan seringnya karantina wilayah, kesehatan mental telah menjadi perhatian penting. Dalam artikel ini, kami membahas masalah deteksi depresi tahap awal dari perilaku pengguna dalam berkicau. Kami mengusulkan metode pembelajaran mendalam untuk memperkirakan intensitas depresi dengan memanfaatkan data media sosial. Pekerjaan ini bertujuan untuk membuat estimasi intensitas depresi yang tepat waktu dari media sosial, untuk membantu dalam perawatan yang tepat sesuai dengan tingkat depresi. Kami mengembangkan teknik pelabelan ulang untuk kumpulan data depresi acuan dengan cara yang diawasi sendiri,
[11] H. Lin, J. Jia, L. Nie, G. Shen, dan T.-S. Chua, “Apa yang dikatakan media sosial tentang stres Anda?” dalamProsiding IJCAI, 2016, hlm. 3775–3781.
[12] M. Akbari, X. Hu, N. Liqiang, dan T.-S. Chua, “Dari tweet ke kesehatan: Deteksi peristiwa kesehatan dari aliran Twitter,” dalamProsiding AAAI, 2016, hlm.
87–93.
[13] T. Anwar dan M. Abulaish, “Mengidentifikasi kelompok dalam forum web gelap—
Pendekatan pengelompokan aglomeratif,” dalamProses. IEEE Int. Konf. Intel.
Aman. informasi., Juni 2012, hlm. 171–173.
[14] T. Anwar dan M. Abulaish, “Kerangka kerja penambangan teks berbasis grafik sosial untuk investigasi log obrolan,”Investasikan., vol. 11, no. 4, hal. 349–362, Desember 2014.
[15] T. Anwar dan M. Abulaish, “Peringkat pengguna forum web yang
berpengaruh secara radikal,”IEEE Trans. Inf. Forensik Keamanan, vol. 10, no.
6, hal. 1289–1298, Juni 2015.
[16] T. Anwar, K. Liao, A. Goyal, T. Sellis, ASM Kayes, dan H. Shen, “Menyimpulkan jenis lokasi dengan penambangan pola geo-sosial-temporal,”Akses IEEE, vol.
8, hlm. 154789–154799, 2020.
[17] M. Park, C. Cha, dan M. Cha, “Suasana hati depresif pengguna digambarkan di twitter,” dalamProses. Lokakarya ACM SIGKDD Informasi Kesehatan. (HI- KDD), 2012, hlm. 1–8.
[18] AT Beck, “Inventaris untuk mengukur depresi,”Jenderal Besar Psikiatri, jilid. 4, tidak. 6, hal. 561, Juni 1961.
[19] G. Shendan lain-lain., “Deteksi depresi melalui pemanenan media sosial: Solusi pembelajaran kamus multimodal,” dalamProsiding Konferensi Gabungan Int.
ke-27. Artif. Intelijen., Agustus 2017, hlm. 3838–3844.
[20] T. Shendan lain-lain., “Deteksi depresi lintas domain melalui pemanenan media sosial,” dalamProsiding Konferensi Gabungan Int. ke-27. Artif. Intelijen., Juli 2018, hlm. 1611–1617.
[21] AT Beck, RA Steer, R. Ball, dan WF Ranieri, “Perbandingan inventaris depresi Beck-IA dan-II pada pasien rawat jalan psikiatri,”
J. Penilaian Kepribadian, vol. 67, no. 3, hal. 588–597, Desember 1996.
[22] LS Radloff, “Skala CES-D: Skala depresi laporan diri untuk penelitian pada populasi umum,”Terapan. Psikolog. Pengukuran., vol. 1, no. 3, hal. 385–401, Juni 1977.
[23] O. Whooley, “Manual diagnostik dan statistik gangguan mental (DSM),” dalam Ensiklopedia Kesehatan, Penyakit, Perilaku, dan Masyarakat Wiley Blackwell Tahun 2014.
[24] M. Park, DW McDonald, dan M. Cha, “Perbedaan persepsi antara pengguna Twitter yang depresi dan tidak depresi,” dalamProc. Konferensi AAAI Weblog Media Sosial, 2013, hlm. 476–485.
[25] M. De Choudhury, M. Gamon, S. Counts, dan E. Horvitz, “Memprediksi depresi melalui media sosial,” dalamProsiding Konferensi AAAI Int. ke-7 Weblog Media Sosial, 2013, hlm. 128–137.
[26] P. Resnik, W. Armstrong, L. Claudino, T. Nguyen, V.-A. Nguyen, dan J. Boyd-Graber, “Beyond LDA: Menjelajahi pemodelan topik yang diawasi untuk bahasa yang berhubungan dengan depresi di Twitter,” dalamProsiding Lokakarya ke-2 Linguistik Komputasi, Psikologi Klinis, Sinyal Linguistik, Realitas Klinis, 2015, hlm. 99–107.
[27] S. Tsugawa, Y. Kikuchi, F. Kishino, K. Nakajima, Y. Itoh, dan H. Ohsaki,
“Mengenali depresi dari aktivitas Twitter,” diProsiding Tahunan ke-33 Konferensi ACM. Sistem Komputasi Faktor Hum., April 2015, hlm. 3187–3196.
[28] Y. Xue, Q. Li, L. Feng, GD Clifford, dan DA Clifton, “Menuju platform mikro-blog untuk merasakan dan meredakan tekanan psikologis remaja,” dalamProc. ACM Conf. Pervas. Ubiquitous Comput. Publikasi Tambahan, September 2013, hlm. 215–218.
[29] Y. Xue, Q. Li, L. Jin, L. Feng, DA Clifton, dan GD Clifford, “Mendeteksi tekanan psikologis remaja dari mikro-blog,” dalam Prosiding Int.
Konferensi Inf. Kesehatan Sains.Melbourne, VIC, Australia: Springer, 2014, hlm. 83–94.
[30] R. Xu dan Q. Zhang, “Memahami kelompok kesehatan online untuk depresi:
Perspektif jaringan sosial dan linguistik,”Jurnal Medis Internet., jilid. 18, tidak. 3, hal. e63, Maret 2016.
[31] F. Sadeque, D. Xu, dan S. Bethard, “Mengukur latensi deteksi depresi di media sosial,”
dalamProsiding Konferensi Internasional ACM ke-11. Penambangan Data Pencarian Web, Februari 2018, hlm. 495–503.
[32] M. Trotzek, S. Koitka, dan CM Friedrich, “Memanfaatkan jaringan saraf dan metadata linguistik untuk deteksi dini indikasi depresi dalam urutan teks,”IEEE Trans. Pengetahuan. Teknik Data., jilid. 32, tidak. 3, hlm.588–601, Maret 2020.
[33] T. Cai, J. Li, AS Mian, R. Li, T. Sellis, dan JX Yu, “Maksimalisasi pengaruh holistik Targetaware dalam jaringan sosial spasial,” IEEE Trans. Pengetahuan. Teknik Data., akses awal, 17 Juni 2020, doi:
10.1109/TKDE.2020.3003047.
[34] J. Li, X. Wang, K. Deng, X. Yang, T. Sellis, dan JX Yu, “Pencarian komunitas paling berpengaruh melalui jaringan sosial besar,” dalamProsiding Konferensi Internasional IEEE ke-33 Teknik Data (ICDE), April 2017, hlm. 871–882.
[35] J. Li, C. Liu, JX Yu, Y. Chen, T. Sellis, dan JS Culpepper, “Pencarian topik berpengaruh yang dipersonalisasi melalui ringkasan jaringan sosial,”IEEE Trans. Pengetahuan. Teknik Data., jilid. 28, tidak. 7, hlm. 1820–1834, Juli 2016.
[36] J. Li dan C. Cardie, “Pembuatan garis waktu: Melacak individu di Twitter,” dalam Prosiding Konferensi Internasional ke-23. Jaringan Seluruh Dunia (WWW), 2014, hlm. 643–652.
[37] J. Li, A. Ritter, C. Cardie, dan E. Hovy, “Ekstraksi peristiwa kehidupan utama dari Twitter berdasarkan tindakan tutur ucapan selamat/belasungkawa,” dalam Prosiding Konferensi Metode Empiris Bahasa Alamiah Proses (EMNLP), 2014, hlm.
1997–2007.
[38] LS Greenberg dan JC Watson,Terapi Berfokus Emosi untuk Depresi Washington, DC, AS: Asosiasi Psikologi Amerika, 2006.
[39] A. Pak dan P. Paroubek, “Twitter untuk analisis sentimen: Ketika sumber daya bahasa tidak tersedia,” dalamProsiding Lokakarya Internasional ke-22 Sistem Pakar Aplikasi Basis Data, Agustus 2011, hlm. 111–115.
[40] C. Strapparava dan A. Valitutti, “Pengaruh WordNet: Perpanjangan afektif dari WordNet,” dalamProsiding LREC, vol. 4, 2004, hal. 40.
[41] S. Ghosh, M. Chollet, E. Laksana, L.-P. Morency, dan S. Scherer, “Affect-LM:
Model bahasa saraf untuk pembuatan teks afektif yang dapat disesuaikan,”
dalamProsiding Pertemuan Tahunan ke-55 Linguistik Komputer Asosiasi, vol. 1, 2017, hlm. 634–642.
[42] JW Pennebaker, ME Francis, dan RJ Booth, “Penyelidikan linguistik dan jumlah kata: LIWC 2001,”Mahway, Rekan Lawrence Erlbaum, jilid. 71, tidak. 2001, hal. 2001.2001.
[43] X. Rong, “Pembelajaran parameter Word2vec dijelaskan,” 2014, arXiv:1411.2738[Daring]. Tersedia: http://arxiv.org/abs/1411.2738 [44] N. Asghar, P. Poupart, J. Hoey, X. Jiang, dan L. Mou, “Pembuatan respon saraf
afektif,” dalamProsiding Konferensi Inf. Penarikan.Grenoble, Prancis:
Springer, 2018, hlm. 154–166.
[45]Apa itu Depresi?Diakses: 12 Mei 2020. [Online]. Tersedia: https://
www.psychiatry.org/patients-families/depression/what- isdepression
[46] E. Loper dan S. Bird, “NLTK: Perangkat bahasa alami,” 2002, arXiv:cs/
0205028[Daring]. Tersedia: https://arxiv.org/abs/cs/0205028 [47] MF Porter. (2001).Snowball: Bahasa untuk Algoritma Stemming
Diakses: 12 Mei 2020. [Online]. Tersedia: http://
snowball.tartarus.org/texts/introduction.html [48] S. Poria, A. Gelbukh, E. Cambria, P. Yang, A. Hussain, dan T. Durrani,
“Menggabungkan daftar emosi SenticNet dan WordNet untuk analisis sentimen,”
dalamProsiding Konferensi Internasional IEEE ke-11. Proses Sinyal., Oktober 2012, hlm. 1251–1255.
[49] T. Baldwin, M.-C. de Marneffe, B. Han, Y.-B. Kim, A. Ritter, dan W. Xu, “Tugas bersama dari lokakarya tahun 2015 tentang teks buatan pengguna yang bising: normalisasi leksikal Twitter dan pengenalan entitas bernama,” dalamProc. Workshop Teks Buatan Pengguna Berisik, 2015, hlm. 126–135.
[50] MM Bradley dan PJ Lang, “Norma afektif untuk kata-kata bahasa Inggris (ANEW): Manual instruksi dan peringkat afektif,” Citeseer, Gainesville, FL, AS, Tech. Rep. C-1, 1999.
[51] DM Blei, AY Ng, dan MI Jordan, “Alokasi Dirichlet Laten,”
J. Mach. Belajar. Res., jilid. 3, hlm. 993–1022, Maret 2003.
[52] S. Hochreiter dan J. Schmidhuber, “Memori jangka pendek panjang,”
Komputasi Neural., vol. 9, no. 8, hal. 1735–1780, 1997.
[53] P. Ramachandran, B. Zoph, dan QV Le, “Mencari fungsi aktivasi,”
2017,arXiv:1710.05941[Daring]. Tersedia: http://arxiv.org/abs/
1710.05941
[54] E. Alcaide, “E-swish: Menyesuaikan aktivasi ke kedalaman jaringan yang berbeda,” 2018,arXiv:1801.07145[Daring]. Tersedia: http://arxiv.org/
abs/1801.07145
[55] L. Lustberg dan CF Reynolds, “Depresi dan insomnia: Pertanyaan tentang sebab dan akibat,”Tidur Med. Pdt., vol. 4, no. 3, hal. 253–262, Juni 2000.