คำสำคัญ: เทคนิคกฎความสัมพันธ์ การทำเหมืองข้อมูล การพัฒนาการศึกษา CRISP-DM ผลการศึกษาเชิงวิชาการมีอิทธิพลสำคัญต่อนักศึกษาทุกคนในการประกอบอาชีพหรือความเป็นไปได้ในการได้รับทุนการศึกษาในอนาคต การวิจัยนี้ใช้เทคนิควิทยาศาสตร์ข้อมูลที่หลากหลายเพื่อค้นหาว่าวิชาใดมีแนวโน้มที่จะทำงานได้ดีและแนะนำให้นักศึกษาทราบ
CRISP-DM (Cross-Industry Standard Process for Data Mining) is a standard data science framework applied to construct a course recommendation model. The researcher created two models obtained using descriptive statistical techniques and Apriori rules mining. The second model, using association rule mining, found that students enrolling in the courses recommended by the model.
The second model is suitable for creating a decision support system that could build more faith than the first model from a statistical technique. In particular, a model based on association rules can introduce specific subjects when considering subjects that students have studied in the past.
ที่มาและความสำคัญของปัญหา
วัตถุประสงค์การวิจัย
ขอบเขตของการวิจัย
กรอบแนวคิดการวิจัย
ขั้นตอนในการสร้างและพัฒนาระบบ
เครื่องมือและอุปกรณ์
ผลที่คาดว่าจะได้รับ
การทำเหมืองข้อมูล
ขั้นตอนการทำเหมืองข้อมูล
ประเภทของข้อมูลที่สามารถทำ Data Mining
ลักษณะเฉพาะของข้อมูลที่ใช้ทำเหมืองข้อมูล
ประโยชน์ของการใช้การทำเหมืองข้อมูล
แนวคิดในการพัฒนาการศึกษา
วรรณกรรมที่เกี่ยวข้องกับการพัฒนาการศึกษา
CRISP-DM Framework
การทดสอบ cross-validation คือ การแบ่งข้อมูลออกเป็นหลายส่วน เช่น 5-fold cross-validation ซึ่งแบ่งข้อมูลออกเป็น 5 ส่วน
วรรณกรรมที่เกี่ยวข้องกับ CRISP-DM
บทความ “การวิเคราะห์ผลการปฏิบัติงานของนักศึกษาระดับปริญญาตรีโดยใช้การขุดข้อมูลทางการศึกษา” (AsifMerceronAli และ Haider, 2017) กล่าวถึงการวิเคราะห์เชิงคาดการณ์ของผลการเรียนของนักศึกษา นักเรียนศึกษาและเลือก CRISP-DM เป็นขั้นตอนการออกแบบการขุดข้อมูลขั้นพื้นฐานเพื่อคาดการณ์ผลลัพธ์ของข้อมูลนักเรียนเมื่อสิ้นสุดรอบการศึกษาหนึ่งปี มีการนำเสนอสถิติเชิงพรรณนา วิเคราะห์เพื่อให้ได้ข้อมูลเชิงลึก แล้วเปรียบเทียบทำนายผลการเรียนกับโมเดลอื่นๆ
เทคนิคการทำเหมืองกฎความสัมพันธ์ ( Association Rules Mining )
เทคนิคการใช้กฎความสัมพันธ์แบบอพริโอริ
วรรณกรรทที่เกี่ยวข้องกับเทคนิค Association Rules
เปรียบเทียบประสิทธิภาพของเทคนิค Apriori และ FP-Growth ในการสร้างกฎการเชื่อมโยงสำหรับมะเร็งต่อมลูกหมาก (ตองคำ, 2018) เปรียบเทียบประสิทธิภาพของเทคนิค Apriori และ FP-Growth ในการสร้างกฎการเชื่อมโยงสำหรับมะเร็งต่อมลูกหมาก ความสัมพันธ์ระหว่างมะเร็งต่อมลูกหมาก ข้อมูลถูกรวบรวมจากฐานข้อมูล SEER ในเดือนมกราคม 2561
สถิติกับการวิจัย
Weka (Waikato Environment for Knowledge Analysis)
หลักสูตรสาขาวิชาวิทยาการคอมพิวเตอร์
SC241 ภาษาอังกฤษเพื่อวิทยาศาสตร์และเทคโนโลยี 1 ภาษาอังกฤษสำหรับวิทยาศาสตร์และเทคโนโลยี 1. SC499 การศึกษาหรือการฝึกงานหรือการฝึกอบรมในต่างประเทศ การศึกษา การฝึกอบรม หรือการฝึกงานในต่างประเทศ
การทำความเข้าใจปัญหา ( Business Understanding )
การเตรียมข้อมูล ( Data Understanding )
การแก้ไข และดัดแปลงข้อมูล ( Data Preparation )
การสร้างและการทดสอบตัวแบบ ( Modeling )
การคัดกรองข้อมูลตามสถิติ
การสร้างต้นแบบจากสถิติเป็นโมเดลลำดับแรก สร้างจากการใช้สถิติ
การสร้างโมเดลที่สอง โดยใช้การทำเหมืองกฎความสัมพันธ์
- กฎความสัมพันธ์ (Association Rules)
- การวัดประสิทธิภาพของกฎความสัมพันธ์ (Support & Confidence)
- การสร้างกฎความสัมพันธ์ด้วย Apriori Algorithm
- การหากฎความสัมพันธ์ Apriori โดยโปรแกรม Weka
หลังจากขั้นตอนการสร้างกฎความสัมพันธ์และการตั้งค่าการค้นหากฎความสัมพันธ์ จากตัวอย่าง ตารางที่ 19 สามารถอธิบายตัวอย่างกฎความสัมพันธ์ 10 ข้อ โดยเรียงลำดับจากค่าความน่าเชื่อถือสูงสุดไปต่ำสุดได้ดังนี้ หลังจากขั้นตอนการสร้างกฎความสัมพันธ์และตั้งค่าการค้นหากฎความสัมพันธ์ จากตัวอย่าง ตารางที่ 20 สามารถอธิบายกฎความสัมพันธ์ได้ 10 ตัวอย่าง โดยเรียงลำดับจากค่าสูงสุดไปหาค่าต่ำสุดได้ดังนี้
การออกแบบการทำงานของโปรแกรม
การนำกฎความสัมพันธ์จำนวนมากเข้าสู่ฐานข้อมูล
การออกแบบข้อมูลนำเข้า
วิธีการวัดประสิทธิภาพข้อมูล
ผลการวัดประสิทธิภาพ
สรุปผลการวิจัยและจัดทำรายงานวิทยานิพนธ์
ผลการทดสอบความแม่นยำของตัวต้นแบบ ( Evaluation )
การนำไปใช้งาน ( Deployment )
การออกแบบข้อมูลนำเข้า
ผู้วิจัยใช้ภาษา PHP เป็นเครื่องมือในการสร้างและออกแบบระบบ และติดต่อฐานข้อมูล My SQL เพื่อจัดเก็บกฎความสัมพันธ์ไว้ในฐานข้อมูล สร้างเกณฑ์การค้นหารวมทั้งชื่อหลักสูตรและผลการเรียน นักศึกษาสามารถเพิ่มรายวิชาตามผลการเรียนที่แสดงในรูปที่ 28 โปรแกรมจะวิเคราะห์และแสดงผลรายวิชาที่แนะนำในการลงทะเบียน โดยมีรายละเอียดต่างๆ เช่น การสนับสนุน ความมั่นใจ และคุณค่าการยกระดับ เป็นต้น
การแสดงผล
สรุปผลการวิจัย
ปัญหาและอุปสรรค
ข้อเสนอแนะ
Improved K-means Clustering Algorithm for Prediction Analysis using Classification Technique in Data Mining International Journal of Computer Applications. January No. 6(. A Hybrid Data Wrapper Analysis Approach for Analyzing College Graduation Rates at Higher Education Institutions Information Systems and Operational Research 2016. Predicted Increase Enrollment in Higher Education Using Neural Networks and Data Mining Techniques Journal of.
การเปรียบเทียบประสิทธิผลของเทคนิค Apriori และ FP-Growth ในการสร้างกฎความสัมพันธ์สำหรับมะเร็งต่อมลูกหมาก วารสารสารสนเทศและเทคโนโลยีประยุกต์ 1(2) 2018. การใช้กฎความสัมพันธ์เพื่อวิเคราะห์ความเสี่ยงของการออกจากนักศึกษาในสาขาเทคโนโลยีสารสนเทศ วารสารของ วิทยาศาสตร์และวิทยาศาสตร์ศึกษา เล่มที่