Page 106 - การวิจัยทางการวัดและประเมินผลการศึกษา
P. 106
3-96 การวิจัยทางการวัดและประเมินผลการศึกษา
3.1 การวเิ คราะหข์ อ้ สอบ เชน่ ความยาก อำ� นาจจำ� แนก ในการพฒั นาแบบทดสอบควรมกี ารวเิ คราะห์
คุณภาพข้อสอบด้านความยาก และอ�ำนาจจ�ำแนก ผลการวิเคราะห์จะใช้ส�ำหรับคัดเลือกข้อสอบที่มีคุณภาพ
ดังน้ันหากไม่มีการวิเคราะห์ข้อสอบ ก็เป็นหลักฐานว่าการพัฒนาแบบทดสอบนั้นยังมีคุณภาพไม่ดีพอตาม
มาตรฐานของการทดสอบ นอกจากนี้ผลการวิเคราะห์ข้อสอบยังช่วยบอกความสอดคล้องกันของข้อค�ำถาม
ต่าง ๆ ในแบบทดสอบ
3.2 การวิเคราะหข์ ้อสอบ หรือแบบทดสอบดว้ ยทฤษฎกี ารวดั ขน้ั สูง ในการวิเคราะหค์ ณุ ภาพขอ้ สอบ
ผู้ปฏิบัติควรรายงานว่าวิเคราะห์ด้วยทฤษฎีใด ทฤษฎีที่ใช้ในการวิเคราะห์ข้อสอบมีสองทฤษฎีที่ส�ำคัญ คือ
ทฤษฎีการวัดแบบด้ังเดิม (classical test theory) และทฤษฎีการตอบข้อสอบ (item response theory)
นอกจากน้ียังต้องอธิบายเหตุผลของการใช้ทฤษฎีเหล่านี้ด้วย การเลือกใช้ทฤษฎีที่ไม่เหมะสมกับข้อมูลจะ
ท�ำให้ผลการวิเคราะห์ข้อสอบไม่ถูกต้อง ซึ่งส่งผลให้การพัฒนาข้อสอบไม่มีคุณภาพด้วย
3.3 ความสมั พนั ธข์ องขอ้ สอบแตล่ ะขอ้ ในฉบบั เดยี วกนั แนวความคดิ ของการวเิ คราะหน์ ี้ คอื ขอ้ สอบ
ท่ีวัดเร่ืองเดียวกันควรมีความสัมพันธ์กัน หากไม่สัมพันธ์กันย่อมสะท้อนว่าข้อสอบเหล่านั้นไม่เหมาะสม
แนวคิดน้ีสอดคล้องกับเร่ืองความเที่ยง หรือความคงเส้นคงวาของผลการตอบของผู้สอบ
3.4 ความสมั พนั ธข์ องคะแนนรายข้อกับคะแนนรวม ความสมั พนั ธร์ ายขอ้ กบั คะแนนรวมเปน็ ขอ้ มลู
ที่สะท้อนคุณภาพของการจ�ำแนกของข้อสอบ ข้อสอบท่ีดีควรมีความสัมพันธ์กับคะแนนรวมเป็นบวก
ซงึ่ สะทอ้ นวา่ ขอ้ สอบขอ้ นน้ั มคี วามเปน็ หนงึ่ เดยี วกนั กบั ขอ้ สอบขอ้ อน่ื ๆ ในแบบทดสอบฉบบั นน้ั หากมขี อ้ สอบ
ที่มีความสัมพันธ์เป็นลบ แสดงว่าข้อสอบข้อน้ันมีความต่างจากข้อสอบข้ออ่ืน ๆ
3.5 ความเที่ยงของมาตรคะแนน (score scale) ความเท่ียงของแบบทดสอบสะท้อนคุณภาพของ
แบบทดสอบเกี่ยวกับความคลาดเคล่ือนของการวัด มาตรวัดหรือแบบทดสอบที่ดีควรมีความเที่ยงที่ยอมรับ
ได้ เช่น ต้ังแต่ 0.8 เป็นต้นไป การเลือกวิธีการวัดความเที่ยงก็มีความส�ำคัญ เพราะต้องเลือกให้สอดคล้อง
กับลักษณะของข้อมูล หากเลือกผิดย่อมท�ำให้การประเมินความเท่ียงไม่เหมาะสม การเลือกวิธีการตรวจสอบ
ความเที่ยงควรพิจารณาจากลักษณะของข้อค�ำถาม เช่น หากข้อสอบเป็นแบบให้คะแนน 0 หรือ 1 ควรตรวจ
สอบความเท่ียงด้วยสูตร KR-20 หรือ KR-21 ส่วนแบบทดสอบที่มีการให้คะแนนแบบมาตรประมาณค่า
ควรตรวจสอบความเที่ยงด้วยสูตรแอลฟาของครอนบาค เป็นต้น
3.6 ความคลาดเคลื่อนมาตรฐานของการวัด ความคลาดเคล่ือนในการวัดมีความสัมพันธ์กับ
ความเท่ียง เพราะต่างก็สะท้อนเรื่องความคลาดเคลื่อนของการวัดในแบบทดสอบ ซ่ึงอาจพิจารณาในประเด็น
ต่อไปน้ี
3.6.1 ความสามารถในการสรุปอ้างอิง (generalizability) ความสามารถในการสรุปอ้างอิง
เป็นเรื่องท่ีตรงกับเร่ืองความเที่ยง แต่ต้องการตรวจสอบและประเมินความเท่ียงหรือความคงเส้นคงวาของ
คะแนนในบริบทของการทดสอบที่กว้างขวางข้ึน เช่น ความคงเส้นคงวาของผลการทดสอบในบริบทของ
จ�ำนวนข้อ ผู้ประเมิน ผู้ตรวจ ที่มีจ�ำนวนแตกต่างกัน ปัจจัยเหล่าน้ีคือเง่ือนไขของการทดสอบ
3.6.2 มิติของการวัด (dimensionality) การวัดใด ๆ ควรมุ่งวัดมิติเดียว คือ ข้อค�ำถามเดียว
ควรวัดส่ิงเดียว ไม่ควรวัดหลายสิ่ง เช่น ข้อสอบกลุ่มสาระวิชาต่าง ๆ ควรวัดส่ิงเดียว แต่ในบางกรณีท่ีแบบ