• Tidak ada hasil yang ditemukan

STUDENT PERFORMANCE PREDICTIONIN AN ONLINE LEARNING MANAGEMENT SYSTEMUSING MACHINE LEARNING

N/A
N/A
Protected

Academic year: 2023

Membagikan "STUDENT PERFORMANCE PREDICTIONIN AN ONLINE LEARNING MANAGEMENT SYSTEMUSING MACHINE LEARNING"

Copied!
143
0
0

Teks penuh

To study the impact of features on prediction performance, the features were divided into two groups based on their characteristics, i.e., features related to students' system usage behavior and features related to scores obtained by students. Next, four datasets were created using the combination of these two feature sets to study the impact of features on predictive performance.

แบบจ าลอง Logistic Regression

แบบจำลองการถดถอยโลจิสติกไม่ใช้กำลังในการคำนวณ การคำนวณข้อมูลสูง ตีความง่าย แต่อาจเกิด Overfitting ได้ โดยแบ่งเป็น 3 ประเภท ดังนี้ (Wikipedia, 2021a)

แบบจ าลอง Naïve Bayes

แบบจ าลอง Support Vector Machine

แบบจ าลอง K-Nearest Neighbor

แบบจ าลอง Decision Tree

แบบจ าลอง Random Forest

แบบจ าลอง XGBoost

เอกสารวิจัยเกี่ยวกับการทำเหมืองข้อมูลทางการศึกษาเพื่อทำนายประสิทธิภาพของนักเรียนโดยใช้วิธีการรวม (Amrieh et al., 2016) เอกสารวิจัยเกี่ยวกับการทำเหมืองข้อมูลการศึกษาเพื่อทำนายผลการเรียนของนักเรียนโดยใช้การผัดวันประกันพรุ่ง (Hooshyar and Pedaste, 2019)

แสดงสรุปงานวิจัยที่เกี่ยวข้องทั้งหมดจ านวน 10 เรื่อง

2 การเลือกคุณลักษณะตามความสัมพันธ์อย่างรวดเร็ว (FCBF), การกำจัดคุณลักษณะแบบเรียกซ้ำ (RFE) ฟอเรสต์แบบสุ่ม, Support Vector Machine และ Artificial Neural Network No.2 Bayes, Neural Network และ Decision Tree

แสดงแผนการด าเนินงานวิจัย

สมดุลของข้อมูลด้วยวิธี SMOTE ของแต่ละชุดข้อมูล แล้วปรับขนาดของข้อมูลแบบ Standardization แล้วเข้าสู่แบบจ าลอง XGBoost เพื่อใช้แบบจ าลอง XGBoost ในการคัดเลือก กลุ่มคุณลักษณะที่มีความส าคัญต่อผลการเรียน จากนั้นน าชุดคุณลักษณะนี้ไปท านายข้อมูลด้วย แบบจ าลอง 7 แบบ ได้แก่ Logistic Regression, Naïve Bayes, Support Vector Machine, K- Nearest Neighbor, Decision Tree, Random Forest แ ล ะ Extreme Gradient Boosting (XGBoost) แล้วเลือกแบบจ าลองที่ดีที่สุดไปปรับค่าพารามิเตอร์ จากนั้นน าชุดข้อมูลการทดสอบ 4 ชุด เข้าสู่แบบจ าลองนี้ และเปรียบเทียบประสิทธิภาพของแบบจ าลองของชุดข้อมูลที่ใช้. สรุปผลการวิจัย อภิปรายผล และข้อเสนอแนะ. การใช้งานระบบร่วมกับคุณลักษณะกลุ่มคะแนน มีประสิทธิภาพที่ดีกว่าแบบจ าลองที่เพียงใช้. ตาราง 14 แสดงค่า Prediction และค่า Recall ของแบบจ าลอง XGBoost ของข้อมูลชุดที่ 1 ข้อมูล คุณลักษณะกลุ่มคะแนน และคุณลักษณะกลุ่มพฤติกรรมการใช้งานระบบ โดยใช้คุณลักษณะ ครบถ้วน. ในส่วนของการศึกษาชุดข้อมูลที่ 3 และ 4 นั้น เราต้องการศึกษาประสิทธิภาพการท านาย ของการใช้คุณลักษณะกลุ่มของพฤติกรรมการเข้าใช้งานระบบ เทียบกับการใช้คุณลักษณะกลุ่ม ของคะแนนสอบ ซึ่งในการศึกษานี้ เราพบว่า ในการสร้างแบบจ าลองที่โดยรวมแล้ว การท านายผล การเรียนด้วยคุณลักษณะกลุ่มของคะแนนสอบแต่เพียงอย่างเดียว จะให้ความแม่นย าสูงกว่า การ ใช้คุณลักษณะกลุ่มของพฤติกรรมการเข้าใช้งานระบบแต่เพียงอย่างเดียว. 2 Total_ScoreQuiz คะแนนแบบทดสอบรวมทุกเรื่อง ด้านคะแนนผลการประเมินการเรียนรู้. 3 ScoreQuiz2 คะแนนแบบทดสอบ เรื่องที่ 2 ด้านคะแนนผลการประเมินการเรียนรู้. 5 Total_ScoreOnlineMeeting คะแนนกิจกรรมในห้องเรียนออนไลน์รวมทุกเรื่อง ด้านคะแนนผลการประเมินการเรียนรู้. วันสุดท้ายการส่งงานมอบหมาย. และวันสุดท้ายการท าแบบทดสอบ เรื่องที่ 3. 8 ScoreAttendance คะแนนการเข้าเรียน ด้านคะแนนผลการประเมินการเรียนรู้. 9 ScoreQuiz5 คะแนนแบบทดสอบ เรื่องที่ 5 ด้านคะแนนผลการประเมินการเรียนรู้. 10 ScoreMidterm คะแนนสอบกลางภาค ด้านคะแนนผลการประเมินการเรียนรู้. 11 ScoreOnlineMeeting1 คะแนนกิจกรรมในห้องเรียนออนไลน์ เรื่องที่ 1 ด้านคะแนนผลการประเมินการเรียนรู้. 12 ScoreQuiz3 คะแนนแบบทดสอบ เรื่องที่ 3 ด้านคะแนนผลการประเมินการเรียนรู้. และวันสุดท้ายการท าแบบทดสอบ เรื่องที่ 4. 23 Total_ScoreAssignment คะแนนงานมอบหมายรวมทุกส่วน ด้านคะแนนผลการประเมินการเรียนรู้. และวันสุดท้ายการท าแบบทดสอบ เรื่องที่ 1. และวันสุดท้ายการท าแบบทดสอบ เรื่องที่ 5. ด้านคะแนนผลการประเมินการเรียนรู้. 30 Total_ClickAssignment จ านวนครั้งที่คลิกเข้าถึงงานมอบหมายรวมทุก. ด้านคะแนนผลการประเมินการเรียนรู้. ข้อเสนอแนะ. เนื่องจากงานวิจัยนี้ออกแบบแบบจ าลองการท านายผลการเรียนส าหรับ Boosting เพียงชนิดเดียวคือ XGBoost แต่แบบจ าลองพวก Boosting มีหลากหลายแบบจ าลอง นอกจาก XGBoost ที่ทดลองสร้างแล้ว ได้แก่ AdaBoost, Gradient Boosting, Light GBM และ CatBoost เพื่อช่วยเพิ่มประสิทธิการท านายมากยิ่งขึ้น. บรรณานุกรม. บรรณานุกรม. Academic Performance Prediction for Engineering Students using RBF-SVM Classification Model.

แสดงรายละเอียดเงื่อนไขของกิจกรรมการเรียนการสอนในระบบ Moodle

แสดงเกณฑ์การพิจารณาตัดเกรด

แสดงเกณฑ์การประเมินผลการเรียนรู้

การจ าแนกคุณลักษณะที่ใช้ในการวิจัย

จากนั้นทบทวนคำตอบและส่งแบบทดสอบเวลา 13:47 น. รหัสนักศึกษา Duration1 Duration2 Duration3 Duration1 Duration2 Duration3 Duration1 Duration2 Duration3 Duration1 Duration2 Duration3 Duration1 Duration2 Duration3 Duration1 Duration2 Duration3.

แสดงรายละเอียดค าอธิบายของชุดข้อมูล

แสดงการจ าแนกกลุ่มเกรดตามระดับผลการเรียน

แสดงการเรียงล าดับคะแนนความส าคัญของชุดข้อมูลส าหรับกรณีที่ 1: ข้อมูลบันทึกการ

แสดงการเรียงล าดับคะแนนความส าคัญของชุดข้อมูลส าหรับกรณีที่ 2: ข้อมูลบันทึก

แสดงการเรียงล าดับคะแนนความส าคัญของชุดข้อมูลในกรณีที่ 3: ข้อมูลบันทึกการใช้

แสดงการเรียงล าดับคะแนนความส าคัญของชุดข้อมูลในกรณีที่ 4: คะแนนกิจกรรมใน

แสดงการเปรียบเทียบความแม่นย าส าหรับชุดข้อมูลที่ตกต่างกัน 4 ชุด ของแต่ละ

Unbalanced enterprise credit rating with DTE-SBD: Decision tree ensemble based on SMOTE and trunking with.

แสดงค่า Prediction และค่า Recall ของแบบจ าลอง XGBoost ของข้อมูลชุดที่ 1 ข้อมูล

แสดงกระบวนการวิเคราะห์ข้อมูลด้วย CRISP-DM

แสดงตัวอย่างการท างานของการเรียนรู้ของเครื่องแบบมีผู้สอน

แสดงตัวอย่างการท างานของการเรียนรู้ของเครื่องแบบไม่มีผู้สอน

แสดงตัวอย่างการท างานของการเรียนรู้ของเครื่องแบบกึ่งมีผู้สอน โดยน ารูป

แสดงตัวอย่างการท างานของการเรียนรู้ของเครื่องแบบเสริมก าลัง โดยสร้างเขา

แสดงกระบวนการท าวิศวกรรมคุณลักษณะ โดยน าข้อมูลหลายแหล่งเข้าด้วยกัน

แสดงตัวอย่างการท างานของการจัดการข้อมูลที่ไม่สมดุลด้วยวิธี SMOTE โดยน า

แสดงการเปรียบเทียบก่อนและหลังการท างานของแบบจ าลอง Logistic

ระบบเปิดให้ส่งงาน พบวันแรกในการดูการมอบหมายงานและวันสุดท้ายในการส่งการมอบหมาย จากนั้นป้อนแบบฟอร์ม K-means Clustering method และแบบจำลองการจำแนกประเภท ซึ่งรวมถึงเครื่องเวกเตอร์สนับสนุน กระบวนการเกาส์เซียน ต้นไม้การตัดสินใจ ฟอเรสต์สุ่ม โครงข่ายประสาทเทียม AdaBoost และ Naive Bayes ถูกค้นพบ พวกเขาสามารถรวมพฤติกรรม งานผัดวันประกันพรุ่งและการทำนายระดับผลการเรียนจากพฤติกรรม นักเรียนเพื่อแบ่งกลุ่มกลุ่มนี้อย่างถูกต้อง ผลตอบแทนสูงสุดคือ 96% โดยใช้โมเดล Support Vector Machine สำหรับคุณสมบัติเชิงตัวเลขรวมกับโมเดลโครงข่ายประสาทเทียมสำหรับข้อมูลเชิงหมวดหมู่ หรือล้มเหลว 85.29% 6 Shrestha and Pokharel Rank 1 Wrapper MethodK-Nearest Neighbor, Naive Bayes, Support Vector Machine, Random Forest and CART Decision Tree Prediction Accuracy Test Level 93.94% 7 Riestra- González, Paule-Ruíz and Ortin (2021).

แสดงการท างานของแบบจ าลอง Support Vector Machine ส าหรับการแบ่ง

แสดงการเปรียบเทียบการท างานของแบบจ าลอง Support Vector Machine

แสดงตัวอย่างการท างานของแบบจ าลอง K-Nearest Neighbor จากการก าหนด

แสดงการท างานของแบบจ าลอง Decision Tree ในโครงสร้างของผังงาน

แสดงการท างานของแบบจ าลอง Random Forest ส าหรับการสร้างชุดข้อมูล

แสดงการท างานของแบบจ าลอง Random Forest ส าหรับการสุ่มเลือก

แสดงการท างานของแบบจ าลอง Random Forest ส าหรับการท างานร่วมกัน

แสดงตัวอย่างการท างานของแบบจ าลอง XGBoost จากการเรียนรู้ข้อมูล 3 ครั้ง

แสดงกระบวนการคัดเลือกคุณลักษณะด้วย Wrapped Method

แสดงตัวอย่างการวัดประสิทธิภาพของแบบจ าลองการท านายอีเมลว่าเป็นสแปม

แสดงตัวอย่างการวัดประสิทธิภาพของแบบจ าลองการท านายอีเมลว่าอยู่

ผู้วิจัยศึกษาพฤติกรรมการใช้งานระบบการจัดการเรียนรู้ของนักเรียนและการให้คะแนนเพื่อทำนายผลการเรียนของนักเรียนว่าจะผ่านหรือไม่ผ่าน โดยใช้ชุดข้อมูลของนักศึกษารายวิชาการเขียนโปรแกรมพื้นฐานและรายวิชาการเขียนโปรแกรมขั้นสูงในระบบการจัดการเรียนรู้ รวม 60 คน จากนั้นนำข้อมูลดังกล่าวมาจัดการความไม่สมดุลของข้อมูลด้วยวิธีเทคนิค Synthetic Minority Oversampling (SMOTE) ด้วยแอตทริบิวต์ วิธีการกรอง แล้วป้อน แบบจำลองการจัดหมวดหมู่ ได้แก่ Naïve Bayes, Neural Network และ Decision Tree แสดงให้เห็นว่าแบบจำลอง Naïve Bayes ที่ใช้คุณสมบัติทั้งหมดและจัดการข้อมูลที่ไม่สมดุลด้วยวิธี SMOTE มี

แสดงแผนผังกระบวนการท างาน

แสดงหน้าแรกการเข้าสู่ระบบ Moodle รายวิชา SWU 141 ชีวิตในโลกดิจิทัล บน

แสดงการเข้าถึงสื่อการเรียนรู้ และแบบทดสอบ จากระบบ Moodle

แสดงการเข้าถึงงานมอบหมายจากระบบ Moodle

แสดงรายการบันทึกกิจกรรมการใช้งานของนิสิตจากระบบ Moodle

แสดงคะแนนแบบทดสอบของนิสิตจากระบบ Moodle

แสดงไฟล์ข้อมูลบันทึกกิจกรรมการใช้งานระบบ Moodle รายวิชา SWU 141

แสดงตัวอย่างบันทึกการใช้งานระบบของนิสิต

แสดงจ านวนครั้งที่คลิกเข้าสู่ระบบ

แสดงจ านวนครั้งที่คลิกเข้าถึงสื่อการเรียนรู้

แสดงจ านวนวันที่ชมสื่อการเรียนรู้

แสดงจ านวนวันระหว่างวันแรกที่เรียน และวันแรกที่ชมสื่อการเรียนรู้

แสดงจ านวนเรื่องที่ชมสื่อการเรียนรู้

แสดงจ านวนครั้งที่คลิกเข้าถึงแบบทดสอบ

แสดงจ านวนวันระหว่างวันที่ท าแบบทดสอบครั้งแรก และวันสุดท้ายการท า

แสดงจ านวนครั้งที่ท าแบบทดสอบซ ้า

แสดงจ านวนเรื่องที่ท าแบบทดสอบ

แสดงระยะเวลาการท าแบบทดสอบ ครั้งที่ 1 ถึง ครั้งที่ 3

แสดงระยะเวลารวมการท าแบบทดสอบรวมทุกครั้ง

แสดงระยะเวลาเฉลี่ยการท าแบบทดสอบรวมทุกครั้ง

แสดงจ านวนครั้งที่คลิกเข้าถึงงานมอบหมาย

แสดงจ านวนวันระหว่างวันแรกที่ส่งงานมอบหมาย และวันสุดท้ายการส่งงาน

แสดงคะแนนกิจกรรมในห้องเรียนออนไลน์

แสดงคะแนนการเข้าเรียน

แสดงคะแนนแบบทดสอบ

แสดงคะแนนการสอบกลางภาค

แสดงคะแนนงานมอบหมาย

แสดงจ านวนนิสิตจ าแนกเกรด

แสดงจ านวนนิสิตจ าแนกเพศ

แสดงจ านวนนิสิตจ าแนกคณะ

แสดงความสัมพันธ์ระหว่างจ านวนครั้งที่คลิกเข้าสู่ระบบกับกลุ่มเกรด

แสดงความสัมพันธ์ระหว่างจ านวนครั้งที่คลิกเข้าถึงสื่อการเรียนรู้รวมทุกเรื่องกับ

แสดงความสัมพันธ์ระหว่างจ านวนวันที่ชมสื่อการเรียนรู้รวมทุกเรื่องกับกลุ่มเกรด

แสดงความสัมพันธ์ระหว่างจ านวนวันระหว่างวันแรกที่เรียนและวันแรกที่ชมสื่อ

แสดงความสัมพันธ์ระหว่างจ านวนเรื่องที่ชมสื่อการเรียนรู้กับกลุ่มเกรด

แสดงความสัมพันธ์ระหว่างจ านวนครั้งที่คลิกเข้าถึงแบบทดสอบรวมทุกเรื่องกับ

แสดงความสัมพันธ์ระหว่างจ านวนวันระหว่างวันที่ท าแบบทดสอบครั้งแรกและ

แสดงความสัมพันธ์ระหว่างจ านวนครั้งที่ท าแบบทดสอบซ ้ากับกลุ่มเกรด

แสดงความสัมพันธ์ระหว่างจ านวนเรื่องที่ท าแบบทดสอบกับกลุ่มเกรด

แสดงความสัมพันธ์ระหว่างระยะเวลารวมการท าแบบทดสอบรวมทุกครั้ง (นาที)

แสดงความสัมพันธ์ระหว่างระยะเวลาเฉลี่ยการท าแบบทดสอบรวมทุกครั้งและ

แสดงความสัมพันธ์ระหว่างจ านวนครั้งที่คลิกเข้าถึงงานมอบหมายกับกลุ่มเกรด

แสดงความสัมพันธ์ระหว่างคะแนนกิจกรรมในห้องเรียนออนไลน์รวมทุกเรื่องกับ

แสดงความสัมพันธ์ระหว่างคะแนนการเข้าเรียนกับกลุ่มเกรด

แสดงความสัมพันธ์ระหว่างคะแนนแบบทดสอบรวมทุกเรื่องกับกลุ่มเกรด

แสดงความสัมพันธ์ระหว่างคะแนนสอบกลางภาคกับกลุ่มเกรด

แสดงความสัมพันธ์ระหว่างคะแนนงานมอบหมายรวมทุกส่วนกับกลุ่มเกรด

แสดงจ านวนนิสิตแต่ละระดับผลการเรียน ก่อนการท า SMOTE

แสดงจ านวนนิสิตแต่ละระดับผลการเรียน หลังการท า SMOTE

แสดงความสัมพันธ์ระหว่างชุดข้อมูลส าหรับกรณีที่ 1 และระดับผลการเรียน โดย

แสดงความสัมพันธ์ระหว่างชุดข้อมูลส าหรับกรณีที่ 2 และระดับผลการเรียน โดย

แสดงความสัมพันธ์ระหว่างชุดข้อมูลส าหรับกรณีที่ 3 และระดับผลการเรียน โดย

แสดงความสัมพันธ์ระหว่างชุดข้อมูลส าหรับกรณีที่ 4 และระดับผลการเรียน โดย

แสดงการเปรียบเทียบความแม่นย าของแบบจ าลองการท านายผลการเรียน โดย

แสดงการเปรียบเทียบความแม่นย าของแบบจ าลองการท านายผลการเรียน โดย

Referensi

Dokumen terkait

(1) Produce a conceptual model of cooperative learning in developing communication and teamwork skills to develop student learning activities using online learning.. (2)