• Tidak ada hasil yang ditemukan

ความแปรปรวนขององค์ประกอบ การ ประมาณค่าความแปรปรวนขององค์ประกอบที่มี

การดำาเนินการวิจัย

1. ความแปรปรวนขององค์ประกอบ การ ประมาณค่าความแปรปรวนขององค์ประกอบที่มี

จากตาราง 4 พบว่า สัมประสิทธิ์การ สรุปอ้างอิงของการตรวจให้คะแนนแบบวัดทักษะ กระบวนการทางวิทยาศาสตร์ ที่ตรวจให้คะแนน ตามรูปแบบผู้ตรวจตรวจข้อสอบทุกข้อของผู้สอบ ทุกคน (T1) มีค่าเท่ากับ. 689 และสัมประสิทธิ์การ สรุปอ้างอิงของการตรวจให้คะแนนแบบวัดทักษะ กระบวนการทางวิทยาศาสตร์ ที่ตรวจให้คะแนน ตามรูปแบบผู้ตรวจตรวจข้อสอบทุกข้อของผู้สอบ บางคน (T2) มีค่าเท่ากับ .927 จะเห็นได้ว่า การ ตรวจให้คะแนนตามรูปแบบ T2 มีสัมประสิทธิ์การ สรุปอ้างอิงสูงกว่า รูปแบบ T1

อภิปรายผล

1. ความแปรปรวนขององค์ประกอบ การ

ความแปรปรวนที่ต้องการให้มีค่าสูง (Sudweeks, Reeve and Bradshaw, 2005) ซึ่งในทฤษฎี

การสรุปอ้างอิงถือว่าองค์ประกอบผู้สอบเป็นสิ่งที่

ต้องการวัด (object of measurement) ไม่จัดว่า เป็นแหล่งความคลาดเคลื่อนของการวัด (Smith and Kulikowich. 2004, ) ทั้งนี้ความแปรปรวน ของผู้สอบที่มีค่าสูง อาจเนื่องมาจากผู้สอบมีความ สามารถแตกต่างกันไปตามประสบการณ์พื้นฐาน (Sudweeks, Reeve and Bradshaw, 2005) ประกอบกับกลุ่มตัวอย่างที่ผู้วิจัยได้มาโดยการ สุ่ม ทำาให้เป็นตัวแทนที่ดีของประชากร ที่มีความ สามารถหลากหลายตั้งแต่น้อยถึงมาก จึงทำาให้ได้

ผู้สอบที่มีความสามารถด้านทักษะกระบวนการ ทางวิทยาศาสตร์แตกต่างกัน

ส่วนความแปรปรวนของข้อสอบในรูป แบบการตรวจให้คะแนนที่ผู้ตรวจตรวจข้อสอบ ทุกข้อของผู้สอบบางคนมีค่าสูงใกล้เคียงกับความ แปรปรวนของผู้สอบ แสดงว่า มีความแตกต่างกัน อย่างมีระบบของผู้สอบในการตอบข้อสอบ ทำาให้

ค่าเฉลี่ยของคะแนนในแต่ละข้อสอบต่างกัน แสดง ถึง ความยากของข้อสอบที่ต่างกัน ทั้งนี้อาจเนื่อง มาจากธรรมชาติของข้อสอบแต่ละข้อ ความแตก ต่างของความรู้พื้นฐานของผู้สอบ หรือความสนใจ ในประเด็นที่ถามหรือเงื่อนไขในสิ่งที่โจทย์กำาหนด ไว้ (Sudweeks, Reeve and Bradshaw, 2005) ทำาให้ข้อสอบบางข้อสะท้อนทักษะกระบวนการได้

มากกว่าข้ออื่นๆ (Smith and Kulikowich, 2004) 2.สัมประสิทธิ์การสรุปอ้างอิง เมื่อใช้รูป แบบการตรวจให้คะแนนต่างกัน พบว่า รูปแบบ การตรวจให้คะแนนที่ผู้ตรวจตรวจข้อสอบทุกข้อ ของผู้สอบบางคน (p: r) x i มีค่าสัมประสิทธิ์การ สรุปอ้างอิงสูงกว่ารูปแบบการตรวจให้คะแนนที่ผู้

ตรวจตรวจข้อสอบทุกข้อของผู้สอบทุกคน (p x i x r) ทั้งนี้อาจเนื่องมาจากการกระจายของคะแนน

ผู้สอบที่ต่างกัน โดยพิจารณาจากสัมประสิทธิ์การก ระจายของคะแนน (C.V.) ถ้าการกระจายของ คะแนนผู้สอบมากสัมประสิทธิ์การกระจายจะมี

ค่ามาก แต่ถ้าการกระจายของคะแนนผู้สอบน้อย สัมประสิทธิ์การกระจายจะมีค่าน้อย ซึ่งจะเห็นว่า รูปแบบการตรวจให้คะแนนที่ผู้ตรวจตรวจข้อสอบ ทุกข้อของผู้สอบบางคนมีค่าสัมประสิทธิ์การกระ จายของคะแนน (C.V.) มากกว่ารูปแบบการตรวจ ให้คะแนนที่ผู้ตรวจตรวจข้อสอบทุกข้อของผู้สอบ ทุกคน จึงส่งผลให้สัมประสิทธิ์การสรุปอ้างอิงมี

ค่าสูงกว่า ประกอบกับการสุ่มกลุ่มผู้สอบเพื่อให้

ผู้ตรวจตรวจโดยไม่ซ้ำากันในรูปแบบการตรวจให้

คะแนนที่ผู้ตรวจตรวจข้อสอบทุกข้อของผู้สอบบาง คนนั้น ผู้วิจัยใช้วิธีการสุ่มอย่างง่าย จึงทำาให้สุ่ม ได้ผู้สอบที่มีความสามารถแตกต่างกันอยู่ในกลุ่ม เดียวกัน ทำาให้คะแนนของผู้สอบในแต่ละผู้ตรวจ มีค่าแตกต่างกันมาก นั่นคือ คะแนนมีการกระจา ยมาก ดังนั้นสัมประสิทธิ์การสรุปอ้างอิงของแบบ วัดจึงขึ้นอยู่กับการกระจายของคะแนน (อนันต์

ศรีโสภา, 2525) สอดคล้องกับผลการวิจัยของน้ำา ผึ้ง อินทะเนตร (2554) ที่พบว่า รูปแบบการตรวจ ให้คะแนนแบบทดสอบปลายเปิดวิชาคณิตศาสตร์

ที่ผู้ตรวจตรวจข้อสอบทุกข้อของผู้สอบบางคนมี

ค่าสัมประสิทธิ์การสรุปอ้างอิงสูงกว่ารูปแบบอื่น เนื่องจากมีการกระจายของคะแนนที่ต่างกัน ซึ่ง กรอนลันด์ (Gronlund, 1976) กล่าวว่า ถ้าความ สามารถของผู้สอบในกลุ่มแตกต่างกันมากการก ระจายของคะแนนจะมาก ทำาให้ความเชื่อมั่นสูง กว่าผู้สอบในกลุ่มที่มีความสามารถใกล้เคียงกัน หรือมีการกระจายของคะแนนน้อย สอดคล้อง กับคันนิงแฮม (Cunningham, 1986) ที่พบว่า ความสามารถของผู้สอบมีหลากหลายหรือมีความ แปรปรวนของคะแนนเพิ่มขึ้นจะส่งผลให้มีค่าความ เชื่อมั่นสูงขึ้น

ข้อเสนอแนะ

1. ข้อเสนอแนะในการนำาผลการวิจัยไปใช้

1.1 การตรวจให้คะแนน คุณสมบัติของ ผู้ตรวจควรกำาหนดให้ชัดเจน ต้องเป็นผู้สอนที่มี

ความเชี่ยวชาญและมีประสบการณ์การสอนใน รายวิชานั้นๆ

1.2 การเลือกรูปแบบการตรวจให้คะแนน สามารถใช้รูปแบบที่ผู้ตรวจตรวจข้อสอบทุกข้อของ ผู้สอบบางคนในรายวิชาอื่นๆ โดยไม่จำาเป็นที่ต้อง ให้ผู้ตรวจตรวจข้อสอบทุกข้อของผู้สอบทุกคน

2. ข้อเสนอแนะในการวิจัยครั้งต่อไป 2.1 ควรศึกษาองค์ประกอบความ แปรปรวนอื่นที่มีผลต่อสัมประสิทธิ์การสรุปอ้างอิง เช่น จำานวนครั้งในการตรวจให้คะแนน จำานวน ของผู้ตรวจ ความยาวของข้อสอบ จำานวนระดับ คะแนนในเกณฑ์การให้คะแนน เพื่อให้มีความน่า เชื่อมากที่สุด

2.2 ควรศึกษาในลักษณะเดียวกันในรายวิ

ชาอื่นๆ ของกลุ่มสาระการเรียนรู้วิทยาศาสตร์หรือ กลุ่มสาระการเรียนรู้อื่น

เอกสารอ้างอิง

ชาญวิทย จรัสสุทธิอิศร. (2545). การพัฒนาเกณฑ์การให้คะแนนทักษะกระบวนการทางวิทยาศาสตร์ขั้น บูรณาการ. ปริญญานิพนธ์ กศ. ม. , มหาวิทยาลัยศรีนครินทรวิโรฒ, กรุงเทพฯ

น้ำาผึ้ง อินทะเนตร. (2554). การศึกษาคุณลักษณะของแบบทดสอบปลายเปิดวิชาคณิตศาสตร์เมื่อจำานวน ผู้ตรวจและรูปแบบการตรวจให้คะแนนต่างกัน โดยใช้โมเดลการสรุปอ้างอิงและโมเดลหลาย องค์ประกอบของราส์ช. ปริญญานิพนธ์ กศ.ด., มหาวิทยาลัยศรีนครินทรวิโรฒ, กรุงเทพฯ.

ศิริชัย กาญจนวาสี. (2555). ทฤษฎีการทดสอบแนวใหม่ (MODERN TEST THEORIES). (พิมพ์ครั้งที่

4). กรุงเทพฯ: สำานักพิมพ์จุฬาลงกรณ์มหาวิทยาลัย.

สถาบันส่งเสริมการสอนวิทยาศาสตร์และเทคโนโลยี. (2554). คู่มือครูรายวิชาเพิ่มเติมชีววิทยา เล่มที่

2.กรุงเทพมหานคร: 2554.สกสค.

สมนึก ภัททิยธนี. (2553). การวัดผลการศึกษา (พิมพ์ครั้งที่ 7). กาฬสินธุ์: ประสานการพิมพ์.

อนันต์ ศรีโสภา. (2525). การวัดผลการศึกษา (พิมพ์ครั้งที่ 3). กรุงเทพฯ: ไทยวัฒนาพานิช.

Brennan, R. L. , Gao, Xiaohang and Colton, Dean A. (1995). Generalizability analysis work key listening and writing testing. Educational and psychological measurement. 55 (2), 57-176.

Cunningham, George K. (1986). Education and psychological measurement. New York:

Macmillan.

Dunbar, S. B. , Koratz, D. M. and Hoover, H. D. (1991). Quality control in the development and use of performance assessment. Applied measurement in education. 4, 289–304.

Grounlund, Norman E. (1976). Measurement and evaluation in testing (3rd ed). New York:

Macmillan.

Lane, Suzanne and others. (1996). Generalizability and validity of mathematics performance assessment. Journal of education measurement. 33 (1), 71–92.

Mehrens, William A. and Lehmann, Irvin J. (1972). Measurement and evaluation in education and psychology. New York: Rinehart and Winton.

Smith, Everett V. and Kulikowich, Jonna M. (2004). An Application of generalizability theory and many-facet rash measurement using A complex problem solving skills assessment. Education and psychological measurement. 64 (4), 617-639.

Sudweeks, Richard. , Reeve, Susanne. and Bradshaw, William S. (2005). A comparison of generalizability theory and many-facet rash measurement in an analysis of college sophomore writing. Assessment writing. 9 (3): 239–261.

Garis besar

Dokumen terkait