Page 103 - การวิจัยทางการวัดและประเมินผลการศึกษา
P. 103
การออกแบบการวิจัย 3-93
ครอนบาคเสนอความเห็นที่ท้าทายความคิดเห็นของนักวัดรุ่นก่อน ๆ โดยตั้งค�ำถามว่า ในการตรวจ
สอบความตรง เราก�ำลังตรวจสอบอะไรกันแน่ และค�ำว่า “ตรง” คือความตรงของอะไร สุดท้ายครอนบาค
(1971) กล่าวเสนอว่า สิ่งที่ควรประเมินว่าตรงระดับมากหรือน้อยนั้น จริง ๆ แล้วก็คือ “ความหมายของ
คะแนน” (meaning) “การแปลผลคะแนน” (interpretation) และ “การน�ำคะแนนไปใช้” (implication)
จากข้อเสนอของครอนบาคตรงนี้ มีนักวัดและนักวิชาการด้านการทดสอบหลายคนเห็นคล้อยตามกัน ใน
ประเด็นที่ว่า ความตรงไม่ใช่เร่ืองความตรงของแบบวัด หรือเครื่องมือวัด แต่เป็นความตรงของ “ความหมาย
ของคะแนน (meaning)” “การแปลผลคะแนน (interpretation)” และ “การนำ� คะแนนไปใช้ (implication)”
ดังที่กล่าวมาแล้ว
แนวคิดนี้น�ำไปสู่การให้นิยามของความตรงในยุคต่อมา เช่น เมสซิค (Messick, 1995) กล่าวว่า การ
ตรวจสอบความตรง เป็นการพิจารณาในเชิงประเมินแบบภาพรวม หรือองค์รวมว่าหลักฐานท่ีเก็บรวบรวมมา
จะใช้ประเมินความตรงได้เหมาะสมหรือไม่ รวมถึงการหาเหตุผลเชิงทฤษฎีที่สนับสนุนถึงความเหมาะสมและ
เพียงพอของการแปลความหมายและการใช้คะแนนการวัด/ประเมิน ได้มากน้อยเพียงใด ดังค�ำว่า
“validity is an overall evaluative judgement of the degree to which empirical
evidence and theoretical rationales support the adequacy and appropriateness of
interpretation and actions on the basis of test scores or other modes of assessments”
(Messick, 1995, p. 741)
ตามมาตรฐานของการทดสอบทางการศึกษาและจิตวิทยา ฉบับที่ 5 (AERA, APA, & NCME,
1999) ประเด็นของการศึกษาเร่ืองความเหมาะสมของการวัดและการแปลผล ครอบคลุมการศึกษาหลักฐาน
ของความเหมาะสมทั้งหมด 5 ประเด็น ดังต่อไปนี้
1. หลักฐานเกี่ยวกับเนื้อหา (content-related evidence)
2. หลักฐานเก่ียวกับกระบวนการตอบของผู้สอบ (response process)
3. หลักฐานเก่ียวกับโครงสร้างภายในของแบบทดสอบ/แบบวัด (internal structure)
4. หลักฐานเก่ียวกับความสัมพันธ์ของคะแนนกับตัวแปรอื่น ๆ (relations to other variables)
5. หลักฐานเกี่ยวกับผลกระทบของการใช้คะแนน (consequential evidence)
1. หลกั ฐานเกยี่ วกับเน้อื หา (content-related validity evidence)
การตรวจสอบหลักฐานเก่ียวกับเน้ือหาส่วนใหญ่เป็นการประเมินโดยผู้เชี่ยวชาญ หลักฐานเก่ียวกับ
เน้ือหาที่ควรตรวจสอบมีดังน้ี
1.1 การตรวจสอบโครงสร้างการสร้างแบบทดสอบ (test blueprint) เป็นการตรวจสอบความ
เหมาะสมของพิมพ์เขียวของแบบทดสอบว่ามีความเหมาะสมหรือไม่ การตรวจสอบนี้เป็นการประเมินของ
ผู้เชี่ยวชาญด้านเน้ือหา