23
PERANAN DATA RAYA DALAM SISTEM PENDIDIKAN:
SATU TINJAUAN
[THE ROLE OF BIG DATA IN THE EDUCATION SYSTEM:
A REVIEW]
*1JANNAH TALIB
1 FARIZA KHALID
1Fakulti Pendidikan, Universiti Kebangsaan Malaysia, 43600 Bangi, Selangor Darul Ehsan, Malaysia.
*Corresponding Author
ABSTRACT
The development of the 4th Industrial Revolution (IR4.0) changed the world of Education towards the widespread use of technology. The use of modern technology involves the comprehensive use of big data in the world of Education and daily. This study aims to briefly explore the use and importance of public data in Education. This study is based on using a literature review approach in the form of descriptive research analysis and data from the literature. Several methods have been used for the purpose of collecting and analyzing literature. First, the study was conducted using the database or Google search engine and Google Scholar as the automatic search medium. Second, databases or search engines such as SCOPUS, Web of Science (WOS), SPRING, ELSEVIER, SCIRP, JSTOR TAYLOR & FRANCIS, and so on have been used to access the websites of indexed journals. English terms such as Big Data and Big Data in Education are used as keywords in the search of journals/articles. In the selection process, this study is only limited to the latest study between 2015 until 2020. This study ends with a proposal in the future so that there will be more empirical studies on public data that can be studied by researchers in Malaysia. In addition, in order to provide in-depth knowledge to the public on the use of big data (big data) in the education system in order to give a clear picture of the use of big data in the current education system.
Keywords: Public Data, Education, Learning Analysis, Learning Environment, 4th Industrial Revolution (IR4.0)
ABSTRAK
Perkembangan Revolusi Industri ke-4 (IR4.0) mengubah dunia Pendidikan kearah penggunaan teknologi secara meluas. Penggunaan teknologi masa kini melibatkan penggunaan data raya secara menyeluruh dalam dunia Pendidikan dan harian. Kajian ini adalah bertujuan untuk meneroka secara ringkas penggunaan dan kepentingan data raya dalam Pendidikan. Kajian ini didasarkan menggunakan pendekatan tinjauan literatur berbentuk analisis penyelidikan deskriptif dan data daripada kesusasteraan. Beberapa kaedah telah digunakan bagi tujuan mengumpul dan menganalisis literatur. Pertama, kajian dijalankan menggunakan pangkalan data atau enjin carian Google dan
24
Google Scholar sebagai medium carian automatik. Kedua, pangkalan data atau enjin carian seperti SCOPUS, Web of Science (WOS), SPRING, ELSEVIER, SCIRP, JSTOR TAYLOR & FRANCIS dan sebagainya telah digunakan untuk mengakses laman-laman web bagi jurnal berindeks. Istilah dalam Bahasa Inggeris seperti Big Data dan Big Data in Education digunakan sebagai kata kunci dalam pencarian jurnal/artikel. Dalam proses pemilihan, kajian ini hanya tertunpu kepada kajian terkini antara tahun 2015 sehingga tahun 2020. Kajian ini berakhir dengan cadangan di masa akan datang agar akan ada lebih banyak lagi kajian berbentuk empirikal mengenai data raya dapat di kaji oleh pengkaji-pengkaji di Malaysia. Selain itu, agar dapat memberi pengetahuan secara mendalam kepada orang ramai mengenai penggunaan data raya (data besar) dalam sistem pendidikan agar dapat memberi gambaran yang jelas tentang penggunaan data raya ini dalam sistem pendidikan masa kini.
Kata kunci: Data Raya, Pendidikan, Analisis Pembelajaran, Persekitaran Pembelajaran, Revolusi
Industri ke-4 (IR4.0).
PENDAHULUAN
Dengan perkembangan Revolusi Industri ke-4 (IR4.0) dapat mengubah persepsi dan sikap manusia terhadap penggunaan data. Istilah ‘data raya’ telah menarik perhatian banyak sektor terutama dalam sektor pendidikan. Data yang dikumpul dan disimpan dirujuk sebagai ‘data raya’ atau ‘data besar’ (Big Data). Penggunaan data raya dapat menghuraikan fenomena yang melibatkan pertumbuhan yang kompleks dan dinamik dalam data (Daniel, 2017). Data raya dapat ditakrifkan sebagai satu ledakan informasi seiring dengan pertumbuhan ekosistem penggunaan aplikasi mudah alih dan data internet (Talib & Khalid, 2020). Istilah data raya atau data besar ini merujuk kepada set data yang begitu besar dan kompleks (Daniel, 2017) yang dikawal oleh Syarikat, pihak berkuasa dan organisasi besar yang tertakluk kepada analisis yang meluas berdasarkan penggunaan algoritma. Selain itu, data raya juga merujuk kepada alatan dan teknologi yang digunakan untuk mengumpul data besar dan tidak boleh dilakukan secara konvensional, kerana memerlukan aplikasi dan ruang yang terlalu besar seperti Terabyte (Klasnja-Milicevic et al., 2017) untuk memproses data raya tersebut. Seterusnya, data raya ini juga boleh digunakan untuk mengenal pasti trend dan corak umum dan juga boleh digunakan untuk memberi kesan kepada individu secara langsung.
Dimensi struktur data raya meliputi lima elemen penting yang dikenali sebagai 5V iaitu saiz/jumlah (Volume), ketulusan/kebenaran (Veracity), pelbagai (Variety), halaju (Velocity) dan nilai (Volue) (Bhatal & Singh, 2019; MAMPU, 2019; European Union, 2017; Kune et al., 2016). Kepelbagaian struktur dan kerumitan untuk mengurus data raya ini adalah disebabkan oleh kemunculan bentuk baharu data yang dijana oleh rangkaian sensor, aplikasi media social dan peranti mudah alih dan lain-lain (Alsheikh, 2019; Daniel, 2017). Dimensi data raya berfungsi untuk menghuraikan penggunaan teknologi inovatif untuk menangkap, menyimpan, mengedar mengurus dan menganalisis set data yang besar dan tidak seragam (heterogen) (Dede et al., 2016). Data raya juga memerihalkan jumlah data yang banyak dan besar secara berstruktur atau tidak berstruktur (Klasnja-Milicevic et al., 2017).
Selain itu, data raya digunakan untuk tujuan analisis tunggal. Data raya bersifat besar dan merujuk kepada pelbagai bentuk. Sekiranya ia tidak diklasifikasikan dengan baik, ia boleh memjadi sesuatu yang membuang masa. Maka adalah penting untuk berpengetahuan dalam mempelbagaikan sumber data yang ada agar dapat mengklasifikasikan kebolehangunaan data raya dan mengetahui kaitannya dalam memudahkan pengumpulan data. Naveen (2017), dan Kune (2016) menyatakan
25
bahawa terdapat lima (5) sumber utama yang membawa kepada data raya iaitu 1) Media sebagai sumber data raya, 2) Cloud sebagai sumber data raya, 3) Web sebagai sumber data, 4) loT sebagai sumber data raya, dan 5) Data sebagai sumber kepada data raya.
Perkembangan data raya ini terjadi dengan peningkatan internet perkara atau ‘internet of things’ (IoT) dalam sistem pendidikan masa kini. Teknologi IoT berupaya untuk mengumpul maklumat daripada pelbagai peranti pintar atau sensor, mengikut protokol yang dipersetujui dan kemudiannya memindahkan maklumat kepada platform aplikasi bagi memproses maklumat dan dikenali sebagai data raya (Li et al., 2019; Talib & Khalid, 2020). Kemunculan data raya dalam pembelajaran berlaku apabila sistem pendagogi Pendidikan diperbaharui melalui penyelidikan dalam pendidikan yang membawa kepada pengumpulan data besar bagi mengumpul data yang ada (Sin & Muthu, 2015; Talib & Khalid, 2020). Kepelbagaian pendekatan dalam pendagogi ini mendorong kepada penghasilan pembelajaran yang pelbagai seperti pembelajaran dalam talian yang membolehkan pengajaran dan pembelajaran dilakukan dimana-mana, pada bila-bila masa dan sebagainya. Aktiviti ini membolehkan pengumpulan data raya atau data besar dilakukan dalam membangunkan persekitaran pembelajaran. Seterusnya penggunaan data raya juga dapat membantu pelajar dalam pembelajaran serta dapat memperbaiki pengalaman pembelajaran secara keseluruhan.
Sehubungan dengan itu, maka perlunya lebih banyak lagi kajian – kajian dilakukan mengenai data raya dalam sistem Pendidikan di Malaysia agar dapat memberi pengetahuan secara mendalam kepada orang ramai mengenai penggunaan data raya (data besar) dalam sistem pendidikan agar dapat memberi gambaran yang jelas tentang penggunaan data raya ini dalam sistem pendidikan masa kini.
SOROTAN LITERATUR
Data raya telah menjadi isu penting untuk sejumlah besar bidang penyelidikan, seperti algoritma, data mining, machine learning, analitik data, web semantik, rangkaian sosial dan kepintaran buatan (Artificial Intelligence). Selain itu, Data raya juga merupakan konsep dan perkembangan teknologi yang signifikan kebelakangan ini. Penggunaan data raya dalam Pendidikan adalah sangat penting (Talib & Khalid, 2020). Ia selaras dengan 9 tonggak utama Kementerian Pendidikan Malaysia (KPM) dalam merealisasikan strategi pendidikan digital 2020-2025, bagi meningkatkan kualiti pendidikan di Malaysia dengan cara mengekalkan penggunaan inovatif seluruh sistem (KPM, 2020). Data raya merupakan tonggak ke-8 dalam strategi Pendidikan digital 2020-2025. Kesedaran mengenai kepentingan data raya dalam bidang pendidikan menjadi lebih serius apabila berkembangnya revolusi industri yang ke-4 (IR4.0). Menurut Abe Keisuke (2019), revolusi industri yang ke-4 (IR4.0) adalah satu era yang melibatkan penggunaan teknologi baharu secara meluas. Hal yang sedemikian ini menjadikan data raya mula diperbincangkan di sana sini dan kini menjadi salah satu tonggak utama dalam sistem Pendidikan Negara. Selain itu, pelbagai agensi kerajaan juga mula mengambil tindakan bagi mewujudkan data raya tertentu dalam sistem mereka.
Penggunaan Data raya dalam Pendidikan telah menambah baik lagi sistem Pendidikan (Talib & Khalid, 2020; Meghji, et al., 2020). Menurut Bhat dan Ahmed (2016), menyatakan bahawa data raya dapat menyediakan alatan yang komprehensif kepada pengkaji untuk memanipulasi dan meramalkan data pembelajaran dan pengajaran di masa akan datang. Selain itu, penggunaan data raya dapat melahirkan teknologi yang baharu dalam sistem pendidikan. Dalam pendidikan Revolusi industri ke-4 ini merangkumi penggunaan automasi, digitalisasi dan kepintaran buatan (Artificial Intelligence), yang membawa kepada cabaran baharu dengan penemuan maklumat dari jumlah data
26
yang besar (data raya) oleh bidang sains data. Internet of things (IoT), Analitik data raya (Big Data Analytics) serta permodelan dan simulasi (Simulation & Modeling) juga merupakan elemen utama dalam era IR4.0.
Rajah 1: Gambaran ringkas mengenai bidang teknologi Pendidikan yang berkaitan dengan data raya (sumber: Daniel, 2017).
Dalam konteks pendidikan masa kini dapat dilihat bahawa analisis data pelajar menjadi satu fenomena penting (Lodge & Corrin, 2017; Talib & Khalid, 2020). Penggunaan data adalah untuk menyokong pembelajaran pelajar. Ia dapat di kesan melalui penyelidikan “Intelligent tutoring systems” (ITS) dan “Artificial intelligence in education” (AIED) (Daniel, 2017). Peningkatan dalam penggunaan set data raya ini adalah untuk membantu guru dalam membuat keputusan mengenai pembelajaran pelajar (Talib & Khalid, 2020). Sebagai contoh penggunaan kohort dapat digunakan sebagai alat peramal pencapaian pelajar dan mengenal pasti jurang tertentu, yang boleh diatasi bagi mempercepatkan lagi proses pembelajaran kerana ia merubah corak dan trend dalam tingkah laku pembelajaran individu pelajar (Talib & Khalid, 2020). Selain itu, penggunaan data raya dalam sistem Pendidikan adalah untuk mengenal pasti strategi baharu bagi mempertingkatkan lagi sistem pembelajaran ke arah yang lebih baik (Mor et al., 2015). Rajah 1 menunjukkan penggunaan pendekatan pengiraan untuk mengesan aktiviti pembelajaran pelajar dan membina model pelajar diagnostic (Daniel, 2017).
Revolusi digital yang membawa kepada kemajuan teknologi inovatif juga adalah faktor yang memberi kesan kepada perubahan pendidikan kepada persekitaran pendidikan yang dicampur dengan bijak termasuk sistem pengurusan pembelajaran (LMS) seperti Moodle, sembang dalam talian, dan banyak lagi. LMS merupakan berperanan penting dalam model pengajaran untuk meningkatkan lagi proses pembelajaran (Magdalena Cantabella et al., 2018). Beberapa penyelidik telah menyiasat perlaksanaan data raya dalam pendidikan. Educational data mining (EDM) dan Learning Analytics (LA) merupakan dua bidang yang berkait rapat dengan penggunaan data raya dalam pendidikan. Educational data mining (EDM) merujuk kepada teknik, alat dan penyelidikan yang di reka untuk mengekstrak aspek dan corak baharu set data raya dengan menggunakan kaedah mesin statistik dan sistem pangkalan data (Talib & Khalid, 2020), untuk memperoleh maklumat yang bermakna daripada repositori data yang besar yang berkaitan dengan aktiviti pembelajaran seseorang dalam setting Pendidikan (Aldowh et al, 2019). EDM digunakan untuk mendapatkan maklumat dari rekod pendidikan melalui log dalam talian dan keputusan peperiksaan. Kemudian semua maklumat tersebut dianalisis untuk mendapatkan kesimpulan. EDM adalah sebuah bidang penemuan pengetahuan dalam pangkalan data (KDD) serta merupakan kawasan penemuan maklumat yang berbeza dan bermanfaat dari sejumlah set data yang terkumpul.
Seterusnya, Learning Analytics (LA) merupakan bidang penyelidikan dan aplikasi yang berkaitan dengan analisis akademik, analitik tindakan dan analisis ramalan (Aldowh et al, 2019). LA
27
merupakan alatan pengukuran, kutipan, analisis dan pelaporan data mengenai pelajar. Konteks LA adalah bertujuan untuk memberi pemahaman dan mengoptimumkan persekitaran pembelajaran. LA tidak seperti EDM, ia adalah kerana LA bertujuan untuk memahami keseluruhan sistem dan menyokong dalam membuat keputusan. Peranan utama LA adalah untuk memantau serta membuat ramalan mengenai prestasi pelajar, serta mengesan isu-isu yang berkemungkinan akan timbul agar jalan penyelesaian dapat diberikan kepada pelajar yang gagal dalam sesuatu bidang atau kursus. EDM dan LA ini telah muncul berikutan daripada dua persidangan komuniti bebas iaitu persidangan “Educational Data Mining” pada tahun 2008 yang telah dianjurkan oleh IEDM, dan persidangan “Learning Analytics” pada tahun 2011 yang telah dianjurkan oleh persatuan SOLAR (Romero & Ventura, 2019). Berikut adalah faktor penggunaan EDM dan LA dalam Pendidikan (Orgaz et al, 2016):
a) Terdapat minat untuk menggunakan pendekatan yang didorong oleh data untuk membuat keputusan yang lebih baik.
b) Terdapat kaedah dan teknik dalam data mining dan mesin serta teknik untuk mencari corak dalam data serta membina model ramalan atau peraturan keputusan yang mudah yang boleh disesuaikan dengan data pendidikan.
c) Agak mudah untuk menjana data serta kapasiti komputer yang digunakan membolehkan untuk membuat penyimpanan dan pemprosesan.
Rajah 2: Platform analisis data yang besar dalam pendidikan tinggi (Klasnja-Milicevic et al., 2017)
Konsep dan analisis data besar berguna dalam sistem pendidikan yang berimpak dalam Pendidikan tinggi (Klasnja-milicevic et al., 2016). Rajah 2 menceritakan mengenai platform analisis data raya dalam Pendidikan pengajian tinggi. Bermula daripada pengurusan data iaitu data diuruskan dan diperoleh mengikut kategori yang telah ditentukan kemudian disimpan dan diproses dan berakhir dengan analisis yang dilakukan bagi menambah baik prestasi dan kualiti pendidik serta Pendidikan negara.
28
Rajah 3: Ilustrasi Data Mining (EDM dan LA) digunakan dalam pendidikan tinggi (Aldowah, 2019)
Rajah 3, menunjukkan ilustrasi data mining (EDM dan LA) yang digunakan dalam pendidikan tinggi. Bermula daripada data yang diambil daripada sistem maklumat pelajar kemudian data tersebut dikumpul dan menjadi data yang besar yang dikenali sebagai data raya.
Penggunaan data raya dalam RI4.0 yang berkaitan dengan kemajuan pesat teknologi inovatif seperti pengkomputeran yang menyeluruh, peranti pintar, selain kursus dalam talian terbuka secara besar-besaran dengan penggunaan media sosial yang tidak terhad secara radikal membentuk semula mod dan akses kepada kaedah pengajaran, pembelajaran dan penilaian (Talib & Khalid, 2020). Ini semua faktor yang berpengaruh dalam mengubah pendidikan kepada persekitaran pembelajaran pintar termasuk platform Sistem Pengurusan Pembelajaran (LMS), Membawa Peranti Sendiri (BYOD), E-pembelajaran, Sistem Tutor Pintar (ITS), Forum, Peta Konsep, dan lain-lain. Berikut adalah Penyelidikan data raya atau data besar dalam Pendidikan (Daniel, 2017):
1. Konteks data mungkin tidak diketahui oleh penyelidik.
2. Penyelidik mungkin menggunakan data yang telah dikumpulkan. 3. Muncul epistemology dan analogi.
4. Akauntabiliti etika mungkin tidak diketahui.
5. Memerlukan pengetahuan tambahan mengenai sains data.
6. Struktur data besar dan kompleks (diukur dalam Terabyte, Petabytes, Exabyte). 7. Highly distributed file systems (HDFS), atau NoSQL.
8. Gunakan Hadoop, sistem map reduce, aplikasi web mining, rangkaian sensor, pemantauan trafik.
29
METODOLOGI KAJIAN
Kajian ini didasarkan menggunakan pendekatan tinjauan literatur berbentuk analisis penyelidikan deskriptif dan data daripada kesusasteraan. Beberapa kaedah telah digunakan bagi tujuan mengumpul dan menganalisis literatur. Pertama, kajian dijalankan menggunakan pangkalan data atau enjin carian Google dan Google Scholar sebagai medium carian automatik. Kedua, pangkalan data atau ejen carian seperti SCOPUS, Web of Science (WOS), SPRING, ELSEVIER, SCIRP, JSTOR TAYLOR & FRANCIS dan sebagainya telah digunakan untuk mengakses laman-laman web bagi jurnal berindeks. Istilah dalam Bahasa Inggeris seperti Big Data dan Big Data in Education digunakan sebagai kata kunci dalam pencarian jurnal/artikel. Dalam proses pemilihan, kajian ini hanya tertumpu kepada kajian terkini antara tahun 2015 sehingga tahun 2020.
DAPATAN KAJIAN
Penggunaan internet dan teknologi benar-benar mengubah kehidupan. Berdasarkan tinjauan literatur yang diambil dari tahun 2015 sehingga tahun 2020 berkaitan dua istilah dalam Bahasa Inggeris iaitu Big Data dan Big Data in Education terdapat beberapa jurnal/artikel telah ditemui dan telah diguna pakai. Terdapat beberapa pangkalan data digunakan untuk mencari literatur berkenaan kajian ini antaranya adalah Web of Science (WOS), Wiley Online Library, SPRING, TAYLOR & FRANCIS, Google, Google Scholar.
Hasil daripada carian umum bagi istilah yang pertama iaitu “Big Data”, pangkalan data Web of Science (WOS) menemui sebanyak 56,043 jurnal/artikel, hanya 3 jurnal/artikel sahaja yang di ambil dan diguna pakai dalam kajian ini. Manakala, bagi pangkalan data Wiley Online Library pula sebanyak 441,045 jurnal/artikel di temui dan hanya 3 jurnal/artikel yang digunakan. Seterusnya, bagi pangkalan data Spring pula sebanyak 403,019 jurnal/artikel ditemui dan hanya 1 jurnal/artikel yang digunakan. Bagi pangkalan data Scopus pula sebanyak 12029 jurnal/artikel dan hanya 1 digunakan. Manakala bagi pangkalan data TAYLOR & FRANCIS sebanyak 1043 dan hanya 5 sahaja digunakan. Selain itu, bagi pangkalan data Google sebanyak 7460, 000, 000 jurnal/artikel, hanya 2 ditemui dan bagi pangkalan data Google Scholar pula sebanyak 1260, 000 jurnal/artikel, hanya 0 yang digunakan. Manakala hasil daripada carian umum bagi istilah yang kedua pula iaitu “Big Data in Education”, pangkalan data Web of Science menemui sebanyak 2,201 jurnal/artikel, hanya 4 jurnal/artikel sahaja yang di ambil dan diguna pakai dalam kajian ini. Manakala, bagi pangkalan data Wiley Online Library pula sebanyak 161, 351 jurnal/artikel di temui dan hanya 2 jurnal/artikel yang digunakan. Seterusnya, bagi pangkalan data spring pula sebanyak 124,710 jurnal/artikel ditemui dan hanya 1 jurnal/artikel yang digunakan. Bagi pangkalan data Scopus pula sebanyak 4,495 jurnal/artikel dan hanya 0 digunakan. Manakala bagi pangkalan data TAYLOR & FRANCIS sebanyak 20 dan hanya 1 sahaja digunakan. Selain itu, bagi pangkalan data Google sebanyak 2640,000, 000 jurnal/artikel, hanya 1 ditemui dan bagi pangkalan data Google Scholar pula sebanyak 828000 jurnal/artikel, hanya 0 yang digunakan.
Penemuan Jurnal/artikel yang relevan dan digunakan dalam kajian ini berdasarkan beberapa pangkalan data menggunakan dua istilah iaitu Big Data dan Big Data in Education dapat digambarkan menerusi graf-graf seperti di bawah:
30
Rajah 1: Literatur berkaitan Big Data berdasarkan pangkalan data
Hasil kajian literatur mendapati hanya enam pangkalan data sahaja bagi istilah “Big Data” yang digunakan bagi mencari jurnal/artikel yang relevan untuk digunakan di dalam kajian ini. Jumlah jurnal/artikel yang diperoleh adalah sebanyak 15 buah. Pangkalan data Web of Science (WOS) sebanyak 3 jurnal/artikel iaitu bersamaan dengan 20%, pangkalan data Wiley Online Library pula sebanyak 3 jurnal/artikel bersamaan dengan 20%. Seterusnya, bagi pangkalan data spring pula sebanyak 1 jurnal/artikel bersamaan 7%, pangkalan data Scopus pula hanya 1 jurnal/artikel sahaja bersamaan 7%. Manakala bagi pangkalan data TAYLOR & FRANCIS sebanyak 5 jurnal/artikel bersamaan dengan 33% dan pangkalan data Google sebanyak 2 sahaja diambil untuk digunakan dalam kajian bersamaan dengan 13%.
Rajah 2: Literatur berkaitan Big Data in Education berdasarkan pangkalan data
Manakala hasil kajian literatur mendapati hanya lima pangkalan data sahaja bagi istilah “Big Data in Education” yang digunakan bagi mencari jurnal/artikel yang relevan untuk digunakan di dalam kajian ini. Jumlah jurnal/artikel yang diperoleh adalah sebanyak 9 buah. Pangkalan data Web of Science (WOS) sebanyak 4 jurnal/artikel iaitu bersamaan dengan 44%, pangkalan data Wiley Online Library pula sebanyak 2 jurnal/artikel bersamaan dengan 22%. Seterusnya, bagi pangkalan data spring pula sebanyak 1 jurnal/artikel bersamaan dengan 11%. Manakala bagi pangkalan data TAYLOR & FRANCIS sebanyak 1 jurnal/artikel bersamaan dengan 11% dan pangkalan data Google sebanyak 1 sahaja diambil untuk digunakan dalam kajian bersamaan dengan 11%.
Seterusnya penemuan jurnal/artikel yang releven dan digunakan dalam kajian ini diambil sekitar tahun 2015 hingga tahun 2020 berdasarkan istilah Big Data dan Big Data in Education dapat digambarkan menerusi graf-graf seperti dibawah:
20% 20% 7% 7% 33% 31% 0% 20% 40%
Big Data
Jurnal/Artikel 44% 22% 11% 11% 7% 0% 20% 40% 60%WOS WILEY SpringTAYLOR & FRANCISGoogle
Big Data in Education
31
Rajah 3: Literatur berkaitan Big Data berdasarkan tahun penerbitan
Manakala hasil kajian literatur bagi penemuan jurnal/artikel yang relevan dan digunakan dalam kajian ini berdasarkan tahun pula diambil sekitar tahun 2015 hingga tahun 2020 berdasarkan istilah Big Data. Pada tahun 2015 sebanyak 1 jurnal/artikel bersamaan dengan 7%, pada tahun 2016 dan 2017 sebanyak 3 jurnal/artikel iaitu masing-masing bersamaan dengan 20%. Seterusnya pada tahun 2018 pula adalah sebanyak 2 jurnal/artikel iaitu bersamaan dengan 13%. Pada tahun 2019 sebanyak 5 jurnal bersamaan 33% dan tahun 2020 sebanyak 1 jurnal/artikel bersamaan 7%. Di dapati pada tahun 2019 terdapat banyak kajian ilmiah yang relevan untuk digunakan dalam kajian ini.
Rajah 4: Literatur berkaitan Big Data in Education berdasarkan tahun penerbitan
Seterusnya, hasil kajian literatur bagi penemuan jurnal/artikel yang relevan dan digunakan dalam kajian ini berdasarkan tahun pula diambil sekitar tahun 2015 hingga tahun 2020 berdasarkan istilah Big Data in education. Pada tahun 2015 sebanyak 2 jurnal/artikel bersamaan dengan 22%, pada tahun 2016 dan 2017 sebanyak 1 jurnal/artikel iaitu masing-masing bersamaan dengan 11%. Manakala pada tahun 2018 pula adalah sebanyak 0 jurnal/artikel. Pada tahun 2019 sebanyak 4 jurnal bersamaan 44% dan tahun 2020 sebanyak 1 jurnal/artikel bersamaan 11%. Di dapati pada tahun 2019 terdapat banyak kajian ilmiah yang relevan untuk digunakan dalam kajian ini.
Seterusnya literatur mengikut reka bentuk kajian dapat dilihat seperti dalam rajah 5 di bawah. Terdapat dua (2) reka bentuk kajian yang ditemui iaitu reka bentuk berbentuk experimental dan developmental. 1 3 3 2 5 1 0 2 4 6 2015 2016 2017 2018 2019 2020
Big Data
Jurnal/Artikel 2 1 1 0 4 1 0 2 4 6 2015 2016 2017 2018 2019 2020Big Data in Education
32
Rajah 5: Literatur mengikut Reka Bentuk penyelidikan
PERBINCANGAN
Berdasarkan tinjauan literatur yang telah dilakukan mendapati bahawa data raya dalam sistem pendidikan bukanlah sesuatu yang baharu untuk dibahaskan. Data raya dan analisis ramalan semakin digunakan dalam pendidikan tinggi untuk memudahkan pendidik mengelaskan pelajar serta meramal tingkah laku pelajar (Alsheikh, 2019). Ia telah di kaji dan diperkenalkan sejak sekian lama oleh pengkaji-pengkaji barat. Penggunaan EDM dan LA yang diperkenalkan dalam data raya ini telah menjadikan dunia Pendidikan semakin berkembang pesat seiring dengan perkembangan teknologi masa kini. EDM dan LA merupakan dua komuniti antara disiplin saintis komputer, saintis pembelajaran, psychometricians dan penyelidik dari Kawasan lain dengan matlamat yang sama untuk meningkatkan pembelajaran berdasarkan penggunaan data (Romero & Ventura, 2019). Pada masa kini, terdapat pelbagai kaedah yang boleh digunakan untuk tujuan penggunaan EDM dan LA dalam Pendidikan seperti Rapidminer, SPSS, Weka dan sebagainya (Slater et al., 2017; Romero & Ventura, 2019) bagi membolehkan proses menganalisis data raya dengan mudah.
Seterusnya, data raya boleh berlaku dalam dua (2) kategori atau cara iaitu data berstruktur dan tidak berstruktur (Klasnja-Milicevic et al., 2017), seperti berikut:
i. Data berstruktur
Data berstruktur iaitu mempunyai corak yang menjadikannya mudah untuk dicapai, seperti maklumat audio, video dan media sosial. Ia disimpan menggunakan set data yang ditetapkan (contoh: data pelajar di telefon sekolah) dan begitu mudah untuk menganalisis (MAMPU, 2019).
ii. Data tidak berstruktur
Data tidak berstruktur atau tidak tersusun, seperti tarikh, nombor, fakta dan boleh dijana oleh manusia atau komputer. Contohnya ialah e-mail, di mana badan teks dalam medan mesej mengikut pola tidak set dan analisis tradisional begitu tidak dapat menganalisisnya. Tetapi apabila teknologi berkembang, begitu juga keupayaan untuk meneliti data-data seolah-olah 'rawak' tersebut dan melaporkan kembali cara-cara yang menunjukkan corak, trend, dan membuat ramalan (MAMPU, 2019).
Bagi trend masa hadapan, perlunya kepada pengetahuan yang jelas mengenai tujuan umum penggunaan alatan EDM/LA secara meluas (Romero & Venture, 2019). Selain itu, Joksimovic, Kovanovic dan Dawson (2019) berpendapat bahawa semua universiti dan institusi Pendidikan mempunyai kesedaran tentang manfaat yang terdapat dalam analisis data yang berskala besar tentang pembelajaran pelajar.
0% 50% 100%
experimental developmental
Reka Bentuk penyelidikan
33
Untuk menangani kerumitan analisis pembelajaran penskalaan, Dawson, Poquet, Colvin, Rogers, Pardo dan Gasevic (2018) berpendapat agar kemasukan bentuk baharu model kepimpinan dalam pendidikan untuk merangsang dan menyebarkan perubahan sistematik.
KESIMPULAN
Data raya merujuk kepada jumlah besar maklumat yang di buat atau di kumpul pada setiap hari. Sekolah, kolej, dan universiti menyimpan banyak maklumat mengenai fakulti, guru dan pelajar yang boleh dianalisis untuk mendapat maklumat dan dapat meningkatkan lagi operasi organisasi dalam pendidikan. Sebagai contoh, dalam dunia pendidikan khasnya data raya merujuk kepada data yang besar untuk mengumpul dan menganalisis maklumat pelajar termasuklah kehadiran, gred, skor ujian dan isu disiplin. Semua keperluan ini dapat dibuktikan melalui penyelidikan statistik.
Tidak dinafikan bahawa perlaksanaan data raya dalam sistem pendidikan dapat membawa kepada pelbagai kesan positif dalam pendidikan negara seperti dapat mengesan kadar pelajar yang tercicir dalam pembelajaran, mengenal pasti prestasi pelajar, membantu dan menilai sistem pengajaran dan pembelajaran masa kini, dan sebagainya. Penggunaan data yang banyak dalam pendidikan memberi manfaat dan dapat meningkatkan taraf pendidikan (Bamiah et al., 2018) sama ada pada pengajaran, pembelajaran dan juga sistem pentadbiran. Selain itu, dengan penggunaan data raya juga dapat meningkatkan kualiti latihan kakitangan di sesebuah syarikat atau organisasi (Liu Feng et, al., 2019; Guo Weiwei et, al., 2019; Rachel H. Ellaway, 2019).
Seterusnya, secara keseluruhan kajian ini telah meneroka secara ringkas penggunaan dan kepentingan data raya dalam sistem pendidikan menggunakan pendekatan tinjauan literatur berbentuk analisis penyelidikan deskriptif dan data daripada kesusasteraan. Kajian daripada literatur barat ini telah diambil untuk memberi penerangan serta idea baharu untuk diguna pakai dalam sistem Pendidikan di Malaysia. diharap di masa akan datang agar akan ada lebih banyak lagi kajian berbentuk empirikal mengenai data raya dapat dikaji oleh pengkaji-pengkaji di Malaysia agar dapat memberi pengetahuan secara mendalam kepada orang ramai mengenai penggunaan data raya (data besar) dalam sistem Pendidikan dapat dijalankan atau bagaimana data raya digunakan dalam sistem Pendidikan masa kini.
RUJUKAN
Abe Keisuke. (2019). Data mining and machine learning application for educational big data in the
university. Computer Society. 350-355.
Doi:101109/DASC/PiCom/CBDCom/CyberSciTECH.2019.00071
Aldowah, H., Al-Samarraie, H., & Wan Mohamad Fauzy. (2019). Educational data mining and learning analytics for 21st century higher education: A review and synthesis. Telematics and Informatics, 37, 13-49. doi: 10.1016/j.tele.2019.01.007
Alsheikh, A. N. (2019). Developing an integrated framework to unitize big data for higher education institution in Saudi Arabian. International Journal Computer Science & Information Technology (IJSIT), 11(1), 31-42.
Bhat, A. Z., & Ahmed, I. (2016). Big data for institutional planning, decision support and academic excellence. In 2016 Third MEC International Conference on Big Data and Smart City, 1-5. Diambil dari https://ieeexplore.ieee.org/document/7460353.
Bhathal, S. G., & Singh, A. (2019). Big data: Hadoop framework vulnerabilities, security issues and attacks. doi: 10.1016/j.array.2019.100002
34
Daniel, B. K. (2017). Big Data and data science: A critical review of issues for educational research. British Journal of Educational Technology. doi:10.1111/bjet.12595
Dawson, S., Poquet, O., C., Rogers, T., Pardo, A., & Gasevic, D. (2018). Rethinking learning analytics adoption through complexity leadership theory. In Proceedings of the 8th international conference on learning analytics and knowledge, Sydney, Australia. 236-244. Dede, C., Ho, A., & Mitros, P. (2016). Big Data analysis in higher education: promises and pitfalls.
Diambil dari http://er.educause.edu/-/media/files/articles/2016/8/erm1652.pdf
European Union. (2017). The ethics of big data: balancing economic benefits and ethical questions of big data in the EU policy context. European Economic and Social Committee.
Guo, W., Liu, F., Song, Y., Zhao, X., & Sun, Y., (2019). Research on the Construction of Data Science and Big Data Professional Curriculum System Based on Professional Certification Concept under the Background of New Engineering. International Conference on Education, Management and Computer. 82-87. doi: 10.25236/icemc.2019.017
Joksimovic, S., Kovanovic, V., & Dawson, S. (2019). The journey of learning analytics. HERDSA Review of Higher Education, 6, 37-63
Kementerian Pendidikan Malaysia (KPM). (2020). Strategi Pendidikan digital 2020-2025. Bahagian Sumber dan Teknologi Pendidikan (BSTP) KPM.
Klašnja-Milićević, A., Ivanović, M., & Budimac, Z. (2017). Data science in education: Big data and learning analytics. Computer Applications in Engineering Education, 25(6), 1066–1078. doi:10.1002/cae.21844.
Kune, R., Konugurthi, P. A., Agarwal, A., Chillarige, R. R., & Buyya, R. (2016). The anatomy of big data computing. Software: Practice and Experience, 46(1), 1-33. Doi:10.1002/spe.2374. Li, Y., Wang, C., Wang, Q., Dai, J. & Zhao, Y. (2019). Secure multi-user k-means clustering based
on encrypted IoT data. Computer and Information Science. 12 (2). 35-45.
Liu, F., Guo, W., Chu, H., Liu, L., Li, X., & Lui, M., (2019). Research on AI Direction Construction of Data Science and Big Data Technology under the Background of New Engineering. International Conference on Education, Management and Computer. 754-760. doi: 10.25236/icemc.2019.137
Lodge, J. M., & Corrin, L. (2017). What data analytics can and do say about effective learning. NPJ Science of Learning, 2, 5. Diambil dari https://www.nature.com/articles/s41539-017-0006-5.pdf
M. A. Bamiah, S. N. Brohi & B. B. Rad, (2018). Big Data Technology in Education: Advantages, Implementations and Challenges. Journal of Engineering Science and Technologi. 229-241 Magdalena, C., R. M. Espana, Ayuso, B., & Antonio, J., (2018). Analysis of student behavior in
learning management systems through a big data framework, Future Generation Computer Systems, 30-37. doi.org/10.1016/j.future.2018.08.003
Meghji, F. A., Ahmed Mahoto, N., Ali Unar, M., & Shaikh, M. A. (2020). The role of knowledge management and data mining in improving educational practices and the learning infrastructure. Mehran University Research Journal of Engineering and Technology, 39(2), 310-323. doi:10.22581/muet1982.2002.08.
Mor, Y., Ferguson, R., & Wasson, B. (2015). Editorial: learning design, teacher inquiry into student learning and learning analytics: a call for action. British Journal of Educational Technology, 46, 221-229.
Naveen Joshi. (2017). Top 5 Sources of big data. Diambil dari https://www.allerin.com/blog/top-5-sources-of-big-data.
Orgaz, G. B., Jung, J. J., & Comacho, D. (2016). Sosial big data: Recent achievements and new challenges. Information Fusion 28, 45-59. doi: 10.106/j.inffus.2015.08.005
Portal rasmi unit pemodenan tadbiran dan perancangan pengurusan Malaysia (MAMPU). (2019). Data raya sektor awam. Diambil dari https://www.mampu.gov.my/ms/data-raya-sektor-awam-drsa.
35
Rachel H. Ellaway. (2019). Data Big and Small: Emerging Challenges to Medical Education Scholarship. Academic Medicine. 31-36. doi: 10.1097/ACM.0000000000002465
Romero, C., & Ventura, S. (2020). Educational data mining and learning analytics: An updated survey. WIREs Data Mining and Knowledge Discovery. doi:10.1002/widm.1355
Sin. K., & Muthu. L. (2015). Application of big data in education data mining and analytics – A literature review. ICTACT Journal on Soft Computing. 5, 1035 – 1049.
Slater, S., Joksi movic, S., Kovanovic, V., Baker, R. S., & Gasevic, D. (2017). Tools for educational data mining: A review. Journal of Educational and Behavioral Statistics, 42(1), 85-106. Talib, J. & Khalid, F. (2020). Data raya dalam pendidikan RI 4.0. Bangi: Fakulti Pendidikan UKM.