Please use this identifier to cite or link to this item: https://cuir.car.chula.ac.th/handle/123456789/32123
Title: การเปรียบเทียบประสิทธิภาพของดัชนีความสอดคล้องของข้อคำถามระหว่างดัชนีพาสเกลจีสแควร์และดัชนีเอสไคสแควร์ทั่วไป
Other Titles: The comparison of item fit index efficiency between parscale G² and generalized S-X²
Authors: ธีรนุช จาบประไพ
Advisors: ณัฏฐภรณ์ หลาวทอง
Other author: จุฬาลงกรณ์มหาวิทยาลัย. คณะครุศาสตร์
Advisor's Email: [email protected]
Subjects: ทฤษฎีการตอบสนองข้อสอบ
การวัดผลทางการศึกษา
การทดสอบความสามารถ
การสอบ -- การออกแบบและการสร้าง
การสอบ -- ความตรง
Item response theory
Educational tests and measurements
Ability -- Testing
Examinations -- Design and construction
Examinations -- Validity
Issue Date: 2554
Publisher: จุฬาลงกรณ์มหาวิทยาลัย
Abstract: การวิจัยครั้งนี้มีวัตถุประสงค์เพื่อเปรียบเทียบประสิทธิภาพของดัชนีความสอดคล้องของข้อคำถาม (item fit index) สองชนิดคือ ดัชนีพาสเกลจีสแควร์และดัชนีเอสไคสแควร์ทั่วไป ข้อมูลที่ใช้ในการศึกษาจำลองภายใต้โมเดลทฤษฎีการตอบสนองข้อสอบแบบพหุวิภาค 2 โมเดล คือ Grade Response Model (GRM) และ Generalized Partial Credit Model (GPCM) จัดกระทำข้อมูลตาม 3 เงื่อนไข คือ 1) ความยาวแบบวัด 3 ระดับ คือ 10, 20, และ 40 ข้อ 2) ขนาดกลุ่มตัวอย่าง 3 ระดับ คือ 500, 1000, และ 2000 คน 3) จำนวนรายการคำตอบ 4 ระดับ คือ 3, 5, 7, และ 9 รายการ รวมข้อมูลที่ศึกษาทั้งหมด 72 สถานการณ์ เกณฑ์ที่นำมาใช้ในการประเมินประสิทธิภาพของดัชนีความสอดคล้องของข้อคำถาม คือค่าความคลาดเคลื่อนประเภทที่ 1 และอำนาจการทดสอบ โดยใช้การเปรียบเทียบ 2 กรณี คือ 1.การเปรียบเทียบประสิทธิภาพของดัชนีความสอดคล้องของข้อคำถามทั้งสองชนิดตามเงื่อนไขของ Kang และ Chen (2008) และ 2.การเปรียบเทียบประสิทธิภาพของดัชนีความสอดคล้องของข้อคำถามทั้งสองชนิดโดยใช้สถิติการวิเคราะห์ความแปรปรวนแบบ 2 ทาง ผลการวิจัยพบว่า 1. ในการเปรียบเทียบประสิทธิภาพตามเงื่อนไขของ Kang และ Chen (2008) ดัชนีเอสไคสแควร์ทั่วไปมีประสิทธิภาพในการบ่งชี้ความสอดคล้องของข้อคำถามมากกว่าดัชนีพาสเกลจีสแควร์ในเกือบทุกสถานการณ์ที่ทำการศึกษาเนื่องจากดัชนีเอสไคสแควร์ทั่วไปมีค่าความคลาดเคลื่อนประเภทที่ 1 ในการบ่งชี้ความสอดคล้องของข้อคำถามน้อยกว่าดัชนีพาสเกลจีสแควร์ ใน 70 สถานการณ์ จากทั้งหมด 72 สถานการณ์ (ค่าเฉลี่ยของค่าความคลาดเคลื่อนประเภทที่ 1 ใน 72 สถานการณ์ของดัชนีพาสเกลจีสแควร์ = 0.1535, ค่าเฉลี่ยของค่าความคลาดเคลื่อนประเภทที่ 1 ใน 72 สถานการณ์ของดัชนีเอสไคสแควร์ทั่วไป = 0.0216) 2. ในการเปรียบเทียบประสิทธิภาพโดยใช้สถิติการวิเคราะห์ความแปรปรวนแบบ 2 ทาง ดัชนีเอสไคสแควร์ทั่วไปให้ค่าความคลาดเคลื่อนประเภทที่ 1 น้อยกว่าดัชนีพาสเกลจีสแควร์ใน 5 กรณีที่ทำการศึกษา และดัชนีพาสเกลจีสแควร์ให้อำนาจการทดสอบที่สูงกว่าดัชนีเอสไคสแควร์ทั่วไปทั้ง 6 กรณีที่ทำการศึกษา 3. ดัชนีเอสไคสแควร์ทั่วไปมีโอกาสในการบ่งชี้ข้อคำถามที่สอดคล้องกับโมเดลว่าเป็นข้อคำถามที่ไม่สอดคล้องกับโมเดลน้อยกว่าดัชนีพาสเกลจีสแควร์ (ดัชนีเอสไคสแควร์ทั่วไปมีค่าความคลาดเคลื่อนประเภทที่ 1 น้อยกว่าดัชนีพาสเกลจีสแควร์) ในขณะที่ดัชนีพาสเกลจีสแควร์มีโอกาสในการบ่งชี้ข้อคำถามที่ไม่สอดคล้องกับโมเดลว่าเป็นข้อคำถามที่ไม่สอดคล้องกับโมเดลมากกว่าดัชนีเอสไคสแควร์ทั่วไป (ดัชนีพาสเกลจีสแควร์มีอำนาจการทดสอบมากกว่าดัชนีเอสไคสแควร์ทั่วไป)
Other Abstract: The purpose of this research was to compare the efficiency of two item fit indices-PARSCALE G² and GENERALIZED S-X². Data were simulated under two Polytomous item response theory models- Grade response model (GRM) and Generalized partial credit model (GPCM). Three conditions were manipulated: 1) three levels of test length (10, 20 and 40), 2) three levels of sample size (500, 1000 and 2000), 3) four levels of category (3, 5, 7 and 9). Seventy-two situations were analyzed. Type I error and power of the test were used as criteria to evaluate the efficiency of item fit index in this research in 1) the comparisons of two item fit indices efficiency by Kang and Chen (2008)’ s condition, and 2) the comparisons of two item fit indices efficiency in two-way ANOVA. The results of this research were : 1. The comparisons of two item fit indices efficiency in Kang and Chen (2008)’ s condition, GENERALIZED S-X² had more efficiency than PARSCALE G² in most situations due to the fact that the type I error of GENERALIZED S-X² was less than the type I error of PARSCALE G² in 70 situations out of 72 situations (mean of PARSCALE G² ‘ s type I error = 0.1535, mean of GENERALIZED S-X² ‘s type I error = 0.0216). 2. The comparisons of two item fit indices efficiency in two-way ANOVA, type I error of GENERALIZED S-X² was less than the type I error of PARSCALE G² in 5 cases of 6 cases, and the power of the test of PARSCALE G² was greater than the power of the test of GENERALIZED S-X² in all 6 cases. 3. GENERALIZED S-X² had probability to indicate the fitted items were misfitted items less than PARSCALE G² (GENERALIZED S-X² had type I error less than PARSCALE G²). While PARSCALE G² had probability to indicate the misfitted items were misfitted items more than GENERALIZED S-X² (PARSCALE G² had power of the test more than GENERALIZED S-X²).
Description: วิทยานิพนธ์ (ค.ม.)--จุฬาลงกรณ์มหาวิทยาลัย, 2554
Degree Name: ครุศาสตรมหาบัณฑิต
Degree Level: ปริญญาโท
Degree Discipline: การวัดและประเมินผลการศึกษา
URI: http://cuir.car.chula.ac.th/handle/123456789/32123
URI: http://doi.org/10.14457/CU.the.2011.352
metadata.dc.identifier.DOI: 10.14457/CU.the.2011.352
Type: Thesis
Appears in Collections:Edu - Theses

Files in This Item:
File Description SizeFormat 
teeranuch_ja.pdf2.21 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.