DOI: 10.17933/mti.v12i1.202 27
ANALISIS TOPIK KONTEN YOUTUBER ANAK INDONESIA
MENGGUNAKAN METODE LATENT DIRICHLET ALLOCATION (LDA)
CONTENT’S TOPIC ANALYSIS OF INDONESIAN’S CHILD YOUTUBERS USINGLATENT DIRICHLET ALLOCATION (LDA) METHOD
Clariesta Putri Ardiyanti1, Katarina Nimas Kusumawati2, Ocha Putri Perdana Prihatina3 dan Nur Aini Rakhmawati4
1,2,3,4Institut Teknologi Sepuluh Nopember, Surabaya
Jalan Raya ITS, Keputih, Surabaya, Kota SBY, Jawa Timur, 60117
e-mail: [email protected], [email protected]2, [email protected]3,
Naskah diterima tanggal 17 November 2020, direvisi tanggal 16 Agustus 2021, disetujui pada tanggal 20 September 2021
Abstract
Information technology and media are growing day by day. The rapid dissemination of information and knowledge are happening through social media. YouTube is one of the top-tier social media in Indonesia. Based on the age of the users, YouTube is not only being used by adults but also by children. Therefore, there are various topics for YouTube content. In this research, authors conducted a comprehensive study by using Latent Dirichlet Allocation (LDA) method to determine the dominant topic on children's YouTuber channels in Indonesia. Authors hope that this research can answer the question of “What are dominant topics in child YouTubers in Indonesia?”. In the first step, a number of child YouTuber accounts with more than a million subscribers were selected for analysis and clustering of content topics uploaded on the YouTube channel. 4603 videos from 10 different channels will be analyzed after the crawling process. From the analysis that has been done, it can be concluded that the dominant topics include discussing challenges with food, opening and reviewing toys that have a surprise concept, learning to make a craft (do-it-yourself), and the last topic is reviewing various kinds of ice cream.
Keywords : YouTube, kids YouTuber, Latent Dirichlet Allocation, content, statistical model
Abstrak
Teknologi dan media informasi semakin berkembang dari waktu ke waktu. Persebaran informasi dan pengetahuan dengan cepat dapat terjadi melalui media sosial. YouTube merupakan salah satu media sosial dengan tingkat penggunaan teratas di Indonesia. Ditinjau dari usia penggunanya, YouTube tidak hanya digunakan oleh orang dewasa tetapi juga anak-anak. Oleh sebab itu, topik konten ada YouTube sangat banyak dan beragam. Pada penelitian ini, penulis melakukan penelitian menggunakan metode Latent Dirichlet Allocation (LDA) untuk mengetahui topik yang dominan pada kanal YouTuber anak di Indonesia. Melalui penelitian ini, penulis berharap bisa memberikan informasi topik konten apa saja yang dominan pada YouTuber anak di Indonesia. Langkah pertama, sejumlah akun YouTuber anak yang memiliki subcriber lebih dari satu juta dipilih untuk kemudian dilakukan analisis dan klasterisasi terhadap topik konten dari 4603 video yang diunggah pada 10 kanal YouTube anak-anak. Dari analisis yang telah dilakukan dapat disimpulkan bahwa topik-topik yang dominan antara lain adalah membahas challenge dengan makanan, membuka dan mengulas mainan yang memiliki konsep kejutan, belajar membuat suatu kerajinan tangan (do-it-yourself), dan terakhir adalah topik mengenai ulasan berbagai macam es krim.
28
PENDAHULUAN
YouTube sebagai situs web yang memungkinkan pengguna dengan mudah mengunggah, menonton, dan berbagi video kepada pengguna lainnya sangat diminati oleh penduduk dunia termasuk penduduk Indonesia. Survei yang dilakukan We are Social menyebut bahwa 150 juta penduduk Indonesia aktif menggunakan media sosial dimana YouTube menjadi platform yang paling banyak diakses yaitu mencapai 88% dari total pengguna media sosial pada 2019. Pengguna YouTube di Indonesia memiliki keberagaman usia yang berbeda-beda. Pengguna YouTube berusia di atas 35 tahun mencapai 89% dari total pengguna di Indonesia, sisanya berada di bawah usia tersebut.
Seperti yang sudah diketahui bahwa YouTube telah meluncurkan aplikasi YouTube Kids pada tanggal 15 Februari 2015 silam. Aplikasi ini tidak jauh berbeda dengan induknya (YouTube) kecuali pada orientasinya untuk anak-anak dengan pilihan konten yang dikurasi, fitur kontrol orang tua, dan pemfilteran video yang dianggap tidak pantas untuk anak-anak berusia di bawah 13 tahun. Meskipun tersedia aplikasi YouTube Kids, konten anak-anak tidak dihalangi untuk diunggah ke YouTube. Hal ini memungkinkan viewers (orang yang menonton video yang diunggah) lebih banyak dikarenakan jangkauannya lebih luas.
Pengaruh YouTube terhadap anak-anak tidak terlepas dari pengaruh penggunaan smartphone di Indonesia. Penelitian mengenai
penggunaan smartphone yang pernah
dilakukan sebelumnya menunjukkan bahwa semakin tinggi intensitas penggunaan smartphone dan semakin rendah pengawasan orang tua maka akan semakin tinggi pula perilaku antisosial seseorang. Hal tersebut dikarenakan pengguna smartphone bebas mengakses apa saja yang ada di smartphone tanpa adanya batasan konten apa saja yang boleh diakses (Wahyuningsih & Dra. Taufik Suprihartini, 2017). Tetapi YouTube kini memberikan peringatan untuk video tertentu sesuai batasan umur dari akun pengguna. Hal tersebut sedikit banyak dapat menghindari
anak-anak dalam mengakses konten yang tidak pantas untuk usia anak-anak.
Konten yang dibuat oleh YouTuber anak tidak hanya ditonton oleh seusia mereka. Banyak pengguna YouTube berbagai usia yang memberikan komentar beraneka ragam untuk setiap video yang diunggah. Peran yang dilakukan penononton dalam menanggapi YouTuber anak di Indonesia melalui komentar media sosial untuk sebagian besar dapat dikatakan positif terhadap video dan juga pembuat konten. Positif yang dimaksud adalah penonton memberikan tanggapan baik pujian, saran poositif, dan lain-lain yang membangun. Tanggapan positif tersebut memberi motivasi kepada YouTuber anak untuk membuat konten yang lebih berkualitas (Rakhmawati et al., 2020). Komentar-komentar tersebut tentu akan mempengaruhi perilaku penonton selanjutnya terhadap video tersebut terutama anak-anak.
Di sisi lain, permasalahan terhadap smartphone di Indonesia yang umum terjadi di masyarakat adalah penyalahgunaan pada anak-anak yang disebabkan oleh minimnya kontrol dari orang tua. Anak-anak Indonesia kini sudah aktif dalam menggunakan smartphone dan banyak dari orang tua yang memberikan kebebasan anaknya dalam penggunaan smartphone tersebut. Orang tua dapat mengontrol aktivitas yang dilakukan oleh anak di smartphone terutama YouTube. Memahami pola menonton YouTube dan konten yang sering ditonton atau disukai dapat membantu orang tua memberikan kontrol yang tepat. YouTuber anak mempunyai peran besar dalam penyajian video kepada pengguna seusia mereka. Konten-konten yang dibuat tentu tidak jauh dari keseharian anak-anak bersama smartphone atau aktivitas sosial lainnya. Orang tua pun biasanya akan langsung merujuk pada kata kunci pencarian yang relevan dengan topik anak-anak.
Untuk itu perlu dilakukan penelitian yang mengidentifikasi topik konten yang dominan yang diunggah oleh YouTuber anak pada YouTube dengan metode Latent Dirichlet Allocation (LDA). Pada penelitian sebelumnya, LDA juga digunakan untuk mencari topik pada video K-POP di Youtube(Rahmawati et al.,
29 2021). Kami juga menggunakan LDA untuk
topic modelling pada cuitan akun bot di Twitter (Febriansyach et al., 2021). Penelitian ini mengambil data dari YouTuber anak yang sudah mempunyai jumlah subcriber lebih dari satu juta subcriber. Dari penelitian ini nantinya akan diperoleh topik konten yang dominan diunggah oleh YouTuber anak di Indonesia.
Kajian Literatur Youtuber Anak
YouTube adalah sebuah situs web
dimana pengguna dapat mengunggah,
menonton, dan berbagi video kepada pengguna lainnya. YouTube merupakan salah satu dari sejumlah layanan yang bertujuan untuk menghilangkan hambatan teknis dalam menyebarluaskan video online secara luas. Situs web ini menyediakan antarmuka yang sederhana dan terintegrasi dimana pengguna dapat dengan mudah mengoperasikannya tanpa perlu tingkat pengetahuan teknis yang tinggi.
YouTuber adalah seseorang yang mengupload, membuat produk atau muncul dalam video di situs berbagi video YouTube. YouTuber bisa menghasilkan uang dari YouTube melalui video karyanya yang telah ditonton hingga ribuan kali. YouTuber akan mengembangkan sebuah konten yang menarik untuk mengembangkan kanal mereka.
Popularitas YouTube juga tidak lepas dari kalangan anak-anak. YouTube menjadi sebuah media alternatif yang menggantikan televisi di kalangan anak-anak. Bahkan penelitian lain menyebutkan bahwa pengguna YouTube di bawah 13 tahun mendominasi jumlah penonton YouTube (Araujo et al., 2017). Tidak hanya menjadi penonton saja, rupanya kini sudah banyak anak-anak yang menjadi seorang YouTuber. Namun di sisi lain, Google Policy menyatakan bahwa penerima adsense hanya diperuntukkan untuk pengguna berumur minimal 17 tahun. Artinya anak-anak yang menjadi YouTuber saat ini didukung oleh orang tua mereka untuk menekuni bidang teknologi kreatif pada YouTube. Sehingga YouTuber anak dapat diartikan sebagai seseorang yang berusia kurang dari 17 tahun yang muncul dalam video YouTube dan
membuat konten untuk pengguna YouTube lainnya.
Topic Modelling dengan Menggunakan Metode Latent Dirichlet Allocation (LDA)
Topic modelling merupakan salah satu model yang termasuk dalam unsupervised learning pada machine learning yang dapat digunakan dalam melakukan pengolahan bahasa alami. Topic modelling bekerja dengan metode non-hierarchial clustering (Alfanzar et al., 2020) . Tujuan dilakukan topic modelling adalah menentukan topik secara otomatis pada suatu dokumen. Topik akan berkumpul dengan topik-topik lain yang memiliki kemiripan satu sama lain. Topik menandakan hubungan
variabel yang tersembunyi dan
menghubungkan kata-kata dalam kosakata yang muncul dalam dokumen. Topic modelling akan menemukan tema tersembunyi dalam kumpulan dokumen dan membuat anotasi dokumen yang sesuai dengan tema tersebut (Tong & Zhang, 2016).
Dalam menjalankan proses topic modelling, banyak metode yang dapat dilakukan, salah satunya menggunakan metode Latent Dirichlet Allocation. Latent Dirichet Allocation (LDA) merupakan suatu model probablistik generatif yang bekerja dengan cara mengelompokkan topik yang memiliki kemiripan satu sama lain terhadap beberapa tema pada dokumen yang belum diidentifikasi terdapat tema apa saja di dalamnya berdasarkan proporsi yang dimiliki oleh topik tersebut (Zeng
et al., 2012). Model ini dapat
diimplementasikan menggunakan bahasa pemrograman python dan package LdaModel pada library gensim. Package dapat menghasilkan keluaran berupa grafik yang merujuk pada topik yang diteliti.
Penelitian ini menggunakan referensi dari penelitian sebelumnya yang menggunakan metode LDA yang dilakukan oleh Alif Iffan Alfanzar, dkk pada papernya yange berjudul “Topic Modelling Skripsi Menggunakan Metode Latent Dirichlet Allocation”. Pada kasus ini, LDA digunakan untuk melakukan clustering pada topik skripsi mahasiswa.
30
mengelompokkan dengan melihat jumlah kemunculan kata pada dokumen kemudian menentukan jumlah topik dan jumlah iterasi. LDA bekerja dengan menandai setiap kata pada topik secara semi-random distribution kemudian menghitung probabilitas topik pada dokumen dan menghitung probabilitas kata pada topik setiap iterasinya (Alfanzar et al., 2020).
Text Mining
Text mining menjadi sebuah terminologi yang cukup populer saat ini dan sangat mudah dijumpai dalam berbagai studi yang melibatkan data berbentuk teks (tekstual) dalam skala besar. Teknologi text mining merupakan salah satu sub-bagian dari teknologi penggalian data (data mining). Teknologi penambangan teks (text mining) merupakan sebuah proses ekstraksi informasi dan pola dari sebuah data tekstual yang tidak terstruktur (Zeng et al., 2012). Penambangan teks (text mining) dikenal
sebagai teknologi yang melibatkan
transformasi informasi, pemrosesan dan penerbitan prediksi untuk menghasilkan sebuah informasi penting dan ide-ide terstruktur untuk aktivitas pengolahan pengetahuan (Zhu et al., 2018).
Penggunaan teknologi text mining dalam analisis atau penemuan pengetahuan baru dari suatu data jumlah besar dinilai membantu. Hal tersebut dapat terjadi karena melalui text mining, proses analisis data dalam jumlah besar tersebut dapat dilakukan secara serentak dalam kurun waktu tertentu
(Kobayashi et al., 2018). Dalam
implementasinya, text mining mengikuti langkah-langkah yang dilakukan dalam teknik penambangan data secara umum. Langkah pertama yang dilakukan adalah pre-processing, dilanjutkan dengan proses data mining, dan diakhiri dengan post-processing (Debortoli et al., 2016).
Metodologi Penelitian
Dalam melakukan penelitian kali ini, penulis melakukan serangkaian proses untuk mendapatkan hasil akhir. Gambar 1 merupakan diagram yang menununjukkan proses awal
hingga akhir dari penelitian yang telah dilakukan dan proses tersebut terdiri dari studi literatur, crawling data, data preprocessing, penerapan metode LDA dan yang terakhir analisis data. Metode yang digunakan untuk penelitian ini adalah metode Latent Dirichlet Allocation (LDA). Dalam kasus penelitian ini yang data yang digunakan untuk diolah merupakan judul video dari YouTuber anak yang diunggap pada platform YouTube.
Gambar 1 Diagram Penelitian
(Sumber: Dokumentasi Pribadi, 2020)
1. Studi Literatur
Sebagai langkah awal pembuatan penelitian ini, penulis menggunakan studi literatur untuk menghimpun informasi-informasi yang berkaitan dengan konten dari tulisan ini. Studi literatur dilakukan dengan bantuan berbagai sumber seperti jurnal, artikel ilmiah, tugas akhir, hingga laman resmi terpercaya yang berkaitan dengan topik-topik dalam tulisan ini. Informasi-informasi yang didapatkan antara lain adalah pemaparan mengenai YouTube, pengertian anak dan usia anak, hingga definisi dari metode penelitian yang akan digunakan yakni text mining serta pemaparan mengenai analisis menggunakan metode topic modelling.
Studi Literatur Crawling Data Data Preprocessing Penerapan Metode LDA Analisis Data
31
2. Crawling Data
Metode selanjutnya yang dilakukan adalah menghimpun data-data yang terkait dengan topik YouTuber anak. Topik ini tentunya menyasar platform YouTube dan dengan spesifik memerlukan data YouTuber anak. Oleh karena itu, kegiatan penelitian dilanjutkan dengan menghimpun 10 akun YouTuber anak untuk kemudian dilakukan penambangan data. Crawling data dilakukan untuk mendapatkan judul serta waktu mengunggah dari berbagai video yang diunggah pada akun-akun YouTuber anak yang telah dihimpun sebelumnya. Proses crawling dilakukan dengan menggunakan Youtube API. Kode crawling dapat diakses pada (Ardiyanti et al., 2020a). Selanjutnya, judul, durasi, deskripsi serta waktu pengunggahan video akan dihimpun dalam bentuk data berekstensi .csv sebagai input untuk proses analisis.
a. Data Preprocessing
Data yang sudah didapatkan kemudian
diolah menjadi bentuk yang dapat
mempermudah dan mempercepat pemrosesan data. Tiap koleksi dokumen akan disusun ke dalam suatu index. Tujuan dilakukan pengindeksan adalah agar dokumen yang satu dengan dokumen yang lain dapat dibedakan. b. Penerapan Metode LDA
Tujuan penerapan metode LDA adalah untuk memperoleh distribusi kata yang membentuk suatu topik dan dokumen dengan topik tertentu. Tahap pertama dalam pemodelan LDA adalah menginisiasi parameter. Parameter tersebut dapat berupa jumlah dokumen, banyak kata dalam dokumen, jumlah topik, jumlah iterasi, dan koefisien LDA. Tahap berikutnya adalah menandai suatu kata dengan topik yang telah ditentukan dengan menerapkan semi random distribution berdasarkan metode distribusi dirichlet. Selanjutnya merupakan tahap iterasi. Dalam tahapan ini, terdapat parameter yang dapat menentukan distribusi dari jumlah topik dan distribusi kata dari topik pada suatu dokumen.
c. Analisis Data
Setelah didapatkan raw data yang berisi topik-topik esensial dari video unggahan YouTuber anak-anak, selanjutnya akan
dilakukan proses analisis. Proses analisis dilakukan dengan memanfaatkan metode topic modelling. Metode ini memungkinkan untuk
topik-topik tertentu dikelompokkan
berdasarkan kemiripan pola antara satu sama lain melalui kosakata yang ditemukan.
Topik yang telah didapatkan
menggunakan metode Latent Dirichlet Allocation kemudian dianalisis. Pada tahap sebelumnya, didapatkan grafik yang berisi proporsi-proporsi topik sebagai hasil dari penelitian menggunakan topik tertentu kemudian hasil tersebut akan dianalisis. Hasil ini akan terus dievaluasi untuk menilai seberapa lazim sebuah kata terhadap topik tersebut dan seberapa lazim topik tersebut berada pada suatu dokumen.
HASIL DAN PEMBAHASAN 1. Hasil Penambangan Data
Penambangan data dilakukan terhadap YouTuber anak dengan menggunakan kriteria tertentu. Kriteria tersebut adalah YouTuber anak berusia 17 tahun ke bawah dan memiliki subscriber lebih dari satu juta. Subscriber adalah orang yang berlangganan suatu saluran, sehingga orang tersebut bisa mendapatkan informasi terkini terkait dengan saluran tersebut. Berdasarkan kriteria tersebut, diambil sampel sebanyak 10 YouTuber anak sebagai bahan penelitian. Daftar YouTuber anak tersebut dapat dilihat pada tabel 1. Hasil yang didapatkan dari proses penambangan data akan dimanfaatkan sebagai dasar pemodelan dengan metode LDA pada tahap selanjutnya (Ardiyanti et al., 2020a).
Tabel 1. Daftar Akun YouTube Nama akun YouTube Jumlah
Subscriber
Naisa Alifia Yuriza (N.A.Y) 12.8M
Keira Charma 2.93M Senja Firsta 1.41M Hana Callista 3.21M Zara Cute 2.88M little kenzo 1.02M eybel gaming 1.2M Superduper Ziyan 1.64M Rere Channel 1.35M
Diana Show Indonesia 2.99M Keterangan: M= juta
32
2. Hasil Data Preprocessing
Sebelum melakukan pemodelan dengan menggunakan metode LDA, data dipersiapkan terlebih dahulu. Langkah ini dilakukan dengan mengaktifkan beberapa library yang dibutuhkan. Tahapan yang dilakukan saat melakukan preprocessing data adalah Stopword dan Tokenizing.
a. Stopword
Tahap awal dalam data pre-processing adalah dengan menghilangkan kata-kata yang kurang informatif yang dapat memperburuk keluaran dari data. Kata-kata yang kurang informatif tersebut didefinisikan secara manual. Selain itu, tanda baca yang tidak perlu juga dihilangkan dengan menggunakan fungsi len(). b. Tokenizing
Tujuan dilakukan tokenizing adalah untuk memisahkan kata per kata pada suatu kalimat agar menjadi bagian-bagian kecil dalam suatu array. Metode tokenizing mengandalkan karakter spasi sebagai karakter yang menjadi pemisah antar kata pada suatu kalimat. Langkah-langkah yang dilakukan pada tahapan ini yang pertama adalah membuat suatu list kosong yang nanti akan diisi oleh kumpulan kata-kata. Kemudian, karakter yang berupa uppercase akan diubah menjadi lowercase menggunakan fungsi lower(). Selanjutnya adalah menghilangkan karakter yang tidak perlu menggunakan modul re. Setelah itu kata-kata yang sudah diolah akan ditambahkan pada suatu list kosong yang telah dibuat sebelumnya.
3. Hasil Penerapan Metode LDA
Dokumen yang telah dilalukan tokenizing akan diubah menjadi term dictionary yang memiliki id menggunakan fungsi Corpora. Corpora digunakan untuk melakukan mapping antara tiap kata dengan id. Kemudian dokumen tersbut diubah menjadi document-term matrix
menggunakan modul gensim. Gensim
merupakan suatu modul pada python yang digunakan untuk melakukan topic modelling. Dalam menghasilkan LDA model, penulis menggunakan package LdaModel dengan iterasi sebanyak 100. Setelah dilakukan pemodelan dengan LdaModel, topik-topik yang
koheren akan dihitung menggunakan
CoherenceModel.
4. Hasil Analisis Data
Setelah menerapkan model LDA, data yang didapat kemudian dianalisis. Penilaian model terbaik ditinjau dari besar nilai perplexity dan apakah model tersebut saling berisisan atau tidak. Karena nilai perplexity yang didapatkan bernilai negatif (-), maka semakin besar nilai perplexity-nya, maka model semakin bagus. Untuk mendapatkan hasil terbaik, iterasi yang digunakan sebanyak 100 dan jumlah topik yang dimasukkan adalah 3, 4, dan 5. Pemodelan dengan menggunakan iterasi sebanyak 100 dan jumlah topik 3, didapatkan bahwa nilai perplexity-nya sebesar -20. Pada pemodelan ini, ketiga topik tersebut beririsan meskipun sudah dilakukan beberapa eksekusi. Maka pemodelan dengan menggunakan iterasi sebanyak 100 dan jumlah topik sebanyak 3 tersebut tidak digunakan. Pemodelan dengan menggunakan iterasi sebanyak 100 dan jumlah topik 4, didapatkan bahwa nilai perplexitynya sebesar -20,266. Pada pemodelan ini, keempat topik tersebut tidak saling beririsan atau keempat topik tersebut berbeda satu sama lain. Pemodelan dengan menggunakan iterasi sebanyak 100 dan jumlah topik 5, didapatkan bahwa nilai perplexity-nya sebesar -19,82.
Gambar 2 Tingkat Persebaran Tiap Topik Ditampilkan dalam Bentuk Histogram
33 Tabel 2 Persebaran Topik
No Dominant_Topic Keywords Jumlah
1 0 Makan, challenge, membuat 93 2 1 Mainan, main, surprise 1512 3 2 Belajar, bermain, membuat 1207 4 3 Krim, unik, ice 892
Pada pemodelan ini, terdapat dua topik yang saling beririsan. Berdasarkan faktor-faktor tersebut, maka pemodelan yang digunakan menggunakan iterasi sebanyak 100 kali iterasi serta hasil dengan jumlah topik 4. Pada analisis data, didapatkan topik yang dominan pada dokumen. Berikut adalah topik yang dominan pada tiap dokumen berdasarkan hasil clustering menggunakan metode LDA (Ardiyanti et al., 2020b).
Pada Gambar 2 yang memuat histogram hasil pengolahan persebaran topik, kata yang ditampilkan pada setiap topik hanya terdapat 3 kata. Namun, dari histogram tersebut dapat diperoleh informasi bahwa topik 0 muncul pada video sebanyak 993 video. Topik 0 merupakan topik yang membahas seputar melakukan challenge dengan makanan. Selanjutnya, terdapat topik lain yakni topik 1. Topik 1 merupakan topik yang membahas tentang mainan yang memiliki konsep kejutan atau mainan yang tidak dapat diketahui isinya sebelum dibuka. Pada topik 1 yang dimuat dalam 1512 video ini, YouTuber anak akan melakukan unboxing, review serta memainkan mainan-mainan berkonsep kejutan ini. Pada topik ke 2 diperoleh data sebanyak 1207 video terkait topik YouTuber anak yang membuat konten tentang belajar membuat suatu benda atau biasa dikenal dengan istilah do-it-yourself. Sedangkan topik ke 3 yang dimuat dalam 892 video membahas YouTuber anak yang sedang mengulas atau melakukan review berbagai macam es krim yang dirasa unik baik secara rasa maupun bentuk.
PENUTUP Simpulan
Berdasarkan analisis pada hasil penelitian yang dilakukan pada 10 (sepuluh) kanal YouTuber anak, didapatkan 4 topik teratas yang menjadi pokok bahasan utama dalam video-video yang diunggah. Topik-topik tersebut antara lain adalah membahas challenge dengan makanan, membuka, dan mengulas mainan yang memiliki konsep kejutan, belajar membuat suatu kerajinan tangan (do-it-yourself), dan terakhir adalah topik mengenai ulasan berbagai macam es krim. Selanjutnya, jika topik-topik diurutkan dari topik dominan pertama hingga keempat, maka topik membuka dan mengulas mainan yang memiliki konsep kejutan menempati urutan paling dominan, belajar membuat suatu kerajinan tangan (do-it-yourself) menempati urutan kedua, lalu urutan ketiga challenge dengan makanan serta di urutan keempat terdapat topik mengenai ulasan berbagai macam es krim. Hasil penelitian ini menunjukkan bahwa mayoritas topik-topik tersebut adalah topik yang relevan dengan sebagian besar konten YouTuber anak di Indonesia.
Saran
Berdasarkan hasil dari penelitian yang telah dilakukan, maka penulis bermaksud memberikan saran yang mudah-mudahan dapat bermanfaat bagi pembaca maupun peneliti lain. Mengawasi anak dalam bermedia sosial dan mengakses internet sangat diperlukan. Media YouTube sangat mudah diakses siapa saja sehingga sangat penting bagi orangtua untuk tetap memastikan konten yang diakses anak sesuai dengan usainya.
Selain itu, bagi para content creator yang ingin berfokus pada pembuatan konten untuk anak-anak maka topik video yang diangkat bisa mencakup hasil dari penelitian kali ini yaitu terkait dengan makanan, membuka, dan mengulas mainan yang memiliki konsep kejutan, belajar membuat suatu kerajinan tangan (do-it-yourself), dan terakhir adalah topik mengenai ulasan berbagai macam es krim.
34
Ucapan Terima Kasih
Ucapan terima kasih terutama ditujukan Tuhan yang Maha Esa atas kelimpahan rahmatNya sehingga paper ini dapat diselesaikan dengan baik. Terimakasih juga kepada orang tua dan anggota keluarga kami yang senantiasa mendukung kami serta dosen pembimbing kami, Ibu Nur Aini Rakhmawati yang dengan sabar membimbing kami dalam pengerjaan paper ini.
DAFTAR PUSTAKA
Alfanzar, A. I., Khalid, K., & Rozas, I. S. (2020). Topic Modelling Skripsi Menggunakan Metode Latent Diriclhet Allocation. JSiI (Jurnal Sistem
Informasi), 7(1), 7.
https://doi.org/10.30656/jsii.v7i1.2036
Araujo, C. S., Magno, G., Meira, W., Almeida, V., Hartung, P., & Doneda, D. (2017). Characterizing videos, audience and advertising in Youtube channels for kids. Lecture Notes in Computer Science (Including Subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics). https://doi.org/10.1007/978-3-319-67217-5_21
Ardiyanti, C. P., Kusumawati, K. N., & Prihatina, O. P. P. (2020a). Title Crawler for Kid Youtubers’ Content.
https://doi.org/10.5281/ZENODO.4018838 Ardiyanti, C. P., Kusumawati, K. N., & Prihatina, O. P.
P. (2020b). Topic Modeling for Kids Youtubers’ Content Title using LDA. https://doi.org/10.5281/ZENODO.4018868 Debortoli, S., Müller, O., Junglas, I., & vom Brocke, J.
(2016). Text mining for information systems researchers: An annotated topic modeling tutorial. Communications of the Association for Information Systems, 39(1), 110–135. https://doi.org/10.17705/1cais.03907
Febriansyach, M. A. N., Rashif, F., Nirvana, G. I. P., & Rakhmawati, N. A. (2021). Implementasi LDA untuk Pengelompokan Topik Tweet Akun Bot Twitter bertagar #covid-19. CogITo Smart Journal, 7(1).
https://doi.org/10.31154/cogito.v7i1.299.170-181 Kobayashi, V. B., Mol, S. T., Berkers, H. A., Kismihók,
G., & Den Hartog, D. N. (2018). Text Mining in Organizational Research. In Organizational Research Methods (Vol. 21, Issue 3). https://doi.org/10.1177/1094428117722619 Rahmawati, A., Nikmah, N. L., Perwira, R. D. A., &
Rakhmawati, N. A. (2021). Analisis topik konten channel YouTube K-pop Indonesia menggunakan Latent Dirichlet Allocation. Teknologi: Jurnal Ilmiah Sistem Informasi, 11(1), 16–25.
Rakhmawati, N. A., Susetyo, I. R., Pelawi, D. S. B., Ruslan, B. T., Kayla, A. C., & Adini, A. G. (2020). Analisa Perilaku Penonton Youtuber Cilik Di Indonesia Berdasarkan Komentar Di Media Sosial. Sisfo. https://doi.org/10.24089/j.sisfo.2020.01.002 Tong, Z., & Zhang, H. (2016). A Text Mining Research
Based on LDA Topic Modelling. 201–210. https://doi.org/10.5121/csit.2016.60616
Wahyuningsih, D., & Dra. Taufik Suprihartini, M. S.
(2017). PENGARUH INTENSITAS
PENGGUNAAN SMARTPHONE DAN
PENGAWASAN ORANGTUA TERHADAP
PERILAKU ANTISOSIAL (Kasus penggunaan Smartphone dan Pengawasan Orangtua Siswa SMP Purnama 3 Semarang terhadap Munculnya Perilaku Antisosial). Interaksi Online, 5(2), 1–12. Zeng, L., Li, L., Duan, L., Lu, K., Shi, Z., Wang, M., Wu,
W., & Luo, P. (2012). Distributed data mining: a survey. Information Technology and Management, 13(4), 403–409. https://doi.org/10.1007/s10799-012-0124-y
Zhu, Q., Wu, Y., Li, Y., Han, J., & Zhou, X. (2018). Text mining based theme logic structure identification: application in library journals. Library Hi Tech, 36(3), 411–425. https://doi.org/10.1108/LHT-10-2017-0211