Beyond these current assessments, many researchers are working on virtual
performance assessments for specific higher order intellectual performances, such as
scientific inquiry, that soon may provide reliable, usable, and valid measures for many
21 st century skills (Ketelhut, Dede, Clarke, Nelson, & Bowman, 2007). Research has
documented that higher order thinking skills related to sophisticated cognition (e.g.,
inquiry processes, formulating scientific explanations, communicating scientific
understanding, approaches to novel situations) are difficult to measure with multiple
choice or even with constructed-response paper-and-pencil tests (Resnick & Resnick,
1992; Quellmalz & Haertel, 2004; National Research Council, 2006). In the late 1980s
and 1990s, educators attempted to use performance assessments in accountability
programs. However, the developers of both hands-on and virtual performance
assessments encountered a number of technical, resource, and reliability problems in
large scale administration (Cronbach, Linn, Brennan, & Haertel, 1997; Shavelson, RuizPrimo, & Wiley, 1999). At that time, these problems were substantial enough to undercut
the potentially greater construct validity for science inquiry that performance assessments
can provide over paper-and-pencil tests. Now, however, teams of scholars are using
modern technologies to develop virtual performance assessments of various types (e.g.,
http://virtualassessment.org) that may solve this problem of providing reliable, valid
measurements for sophisticated intellectual and psychosocial skills (Quellmalz &
Pellegrino, 2009).
นอกเหนือจากการประเมินเหล่านี้ปัจจุบัน นักวิจัยจำนวนมากกำลังทำงานอยู่เสมือนประเมินผลประสิทธิภาพสำหรับเฉพาะสูงสั่งแสดงปัญญา เช่นสอบถามทางวิทยาศาสตร์ ที่เร็ว ๆ นี้ อาจมีมาตรการที่เชื่อถือได้ ใช้สอย และใช้สำหรับหลาย21 เซนต์ศตวรรษทักษะ (Ketelhut แทน คลาร์ก เนลสัน และ Bowman, 2007) มีงานวิจัยเอกสารที่สูงสั่งคิดทักษะที่เกี่ยวข้องกับซับซ้อนประชาน (เช่นกระบวนการสอบถาม formulating คำอธิบายทางวิทยาศาสตร์ การสื่อสารทางวิทยาศาสตร์เข้าใจ วิธีกับนวนิยาย) ยากต่อการวัดหลายทางเลือก หรือแม้แต่กับสร้างผลการตอบรับการทดสอบกระดาษ และดินสอ (Resnick และ Resnick1992 Quellmalz & Haertel, 2004 กรรมการวิจัยแห่งชาติ 2006) ในปลายทศวรรษ 1980และปี 1990 ความพยายามที่จะใช้ประเมินประสิทธิภาพการทำงานในความรับผิดชอบโปรแกรม อย่างไรก็ตาม นักพัฒนาประสิทธิภาพการทำงานทั้งภาคปฏิบัติ และเสมือนประเมินผลพบปัญหาทางด้านเทคนิค ทรัพยากร และความน่าเชื่อถือในจัดการขนาดใหญ่ (Cronbach งานผลิต เบรนแนน & Haertel, 1997 Shavelson, RuizPrimo, & Wiley, 1999) ในขณะนั้น ปัญหาเหล่านี้ได้พบพอขัดแข้งขัดขามากขึ้นอาจสร้างประเมินประสิทธิภาพที่มีผลบังคับใช้สำหรับคำถามวิทยาศาสตร์สามารถให้ผ่านการทดสอบกระดาษ และดินสอ ตอนนี้ อย่างไรก็ตาม ทีมนักวิชาการใช้13เทคโนโลยีสมัยใหม่เพื่อพัฒนาประสิทธิภาพเสมือนการประเมินผลชนิดต่าง ๆ (เช่นhttp://virtualassessment.org) that may solve this problem of providing reliable, validmeasurements for sophisticated intellectual and psychosocial skills (Quellmalz &Pellegrino, 2009).
การแปล กรุณารอสักครู่..

นอกเหนือจากการประเมินในปัจจุบันเหล่านี้นักวิจัยหลายคนกำลังทำงานอยู่เสมือน
การประเมินผลการดำเนินงานสำหรับการสั่งซื้อที่สูงขึ้นโดยเฉพาะการแสดงทางปัญญาเช่น
สอบถามรายละเอียดเพิ่มเติมทางวิทยาศาสตร์ว่าเร็ว ๆ นี้อาจจะให้เชื่อถือได้ใช้งานและมาตรการที่ถูกต้องสำหรับหลาย ๆ คน
ที่ 21 ทักษะในศตวรรษที่ (Ketelhut, Dede คล๊าร์คเนลสัน และโบว์แมน, 2007) การวิจัยได้
รับการบันทึกว่าทักษะการคิดขั้นสูงที่เกี่ยวข้องกับความรู้ความเข้าใจที่มีความซับซ้อน (เช่น
กระบวนการสอบถามรายละเอียดเพิ่มเติมการกำหนดคำอธิบายทางวิทยาศาสตร์การสื่อสารทางวิทยาศาสตร์ที่
เข้าใจวิธีการสถานการณ์นวนิยาย) เป็นเรื่องยากที่จะวัดมีหลาย
ทางเลือกหรือแม้กระทั่งกับการทดสอบกระดาษและดินสอสร้างการตอบสนอง (เรสนิคและเรสนิค,
1992; & Quellmalz Haertel 2004; สภาวิจัยแห่งชาติ, 2006) ในช่วงปลายทศวรรษที่ 1980
และ 1990, การศึกษาความพยายามที่จะใช้การประเมินผลการปฏิบัติงานในความรับผิดชอบของ
โปรแกรม แต่นักพัฒนาของทั้งสองมือบนและประสิทธิภาพการทำงานเสมือน
การประเมินผลพบจำนวนของเทคนิคทรัพยากรและปัญหาความน่าเชื่อถือใน
การบริหารงานขนาดใหญ่ (ครอนบาค, ลินน์เบรนแนนและ Haertel, 1997; Shavelson, RuizPrimo และไวลีย์, 1999) ในขณะที่ปัญหาเหล่านี้มีมากพอที่จะทำลาย
ความเที่ยงตรงเชิงโครงสร้างที่อาจเกิดขึ้นมากขึ้นสำหรับการสอบถามรายละเอียดเพิ่มเติมด้านวิทยาศาสตร์การประเมินผลการปฏิบัติงานที่
สามารถให้มากกว่าการทดสอบกระดาษและดินสอ ตอนนี้ แต่ทีมงานของนักวิชาการใช้
13
เทคโนโลยีที่ทันสมัยในการพัฒนาการประเมินผลการปฏิบัติงานเสมือนประเภทต่างๆ (เช่น
http://virtualassessment.org) ที่อาจแก้ปัญหาของการให้บริการที่เชื่อถือได้ถูกต้องนี้
วัดทักษะทางปัญญาและทางจิตสังคมที่มีความซับซ้อน (Quellmalz และ
Pellegrino 2009)
การแปล กรุณารอสักครู่..

นอกเหนือจากการประเมินกระแสเหล่านี้ นักวิจัยหลายคนทำงานในการประเมินประสิทธิภาพเสมือน
สำหรับเฉพาะสั่งซื้อสูงทางการแสดง เช่น
สอบถามทางวิทยาศาสตร์ ว่าเร็ว ๆนี้อาจจะให้เชื่อถือได้ ใช้งาน และมาตรการที่ถูกต้องหลาย
ที่ 21 ศตวรรษ ( ketelhut ดีดี ทักษะ , คลาร์ก , เนลสัน &โบว์แมน , 2007 ) วิจัย
เอกสารอื่นๆ ที่เกี่ยวข้องกับทักษะการคิดที่ซับซ้อนทางปัญญา ( เช่น
สอบถามกระบวนการทางวิทยาศาสตร์การอธิบายการสื่อสารวิทยาศาสตร์
ความเข้าใจแนวนวนิยายสถานการณ์ ) ยากที่จะวัดกับตัวเลือกหลาย
หรือแม้แต่สร้างการตอบสนองการทดสอบกระดาษและดินสอ ( เรสนิค&เรสนิค
, 1992 ; quellmalz & haertel , 2004 ; สภาวิจัย แห่งชาติ2006 ) ในช่วงปลายทศวรรษที่ 1980 และ 1990
นักการศึกษาพยายามที่จะใช้ในการประเมินประสิทธิภาพโปรแกรมความรับผิดชอบ
อย่างไรก็ตาม นักพัฒนาของทั้งภาคปฏิบัติและการประเมินประสิทธิภาพเสมือน
พบจำนวนของเทคนิค ทรัพยากร และปัญหาในการบริหารงานแบบ
ขนาดใหญ่ ( ครอนบาค , Linn , เบรนแนน & haertel , 1997 ; shavelson ruizprimo & , , นิ่ง , 1999 ) ในตอนนั้นปัญหาเหล่านี้มีมากเพียงพอที่จะตัดราคา
อาจยิ่งใหญ่ความตรงเชิงโครงสร้างของแบบทดสอบวิทยาศาสตร์สอบถามการปฏิบัติการประเมิน
สามารถให้ผ่านการทดสอบกระดาษและดินสอ ตอนนี้ อย่างไรก็ตาม ทีมนักวิชาการจะใช้เทคโนโลยีที่ทันสมัย
เพื่อพัฒนาสมรรถนะการประเมินเสมือน 13 ประเภทต่างๆ ( เช่น
http://virtualassessment.org ) ที่อาจแก้ไขปัญหานี้ให้น่าเชื่อถือ
การแปล กรุณารอสักครู่..
