It mainly requires processing sentences on a literal
semantic level, and might be best described as a
test of general grammatical competence through
the oral mode. (p. 216)
These reviews need to be considered in the light of evidence
provided by research conducted with independent data.
Three reports have provided data that conflict with ETS
research. Childs (1995) is very critical of the TOEIC. His
independent data suggests that the reliability estimates
provided by ETS are overstated. He also concluded that the
standard error of TOEIC scores is greater than the published
ETS figure, making TOEIC scores less reliable as a measure
of individual progress as score gains tend to be within the
test’s SEM. Hirai (2002) also expressed doubts about the
ability of TOEIC to predict individual oral and written
English proficiency. In a study conducted with employees
of a major Japanese company, he suggested that the TOEIC
was especially unreliable as a predictor of spoken English
for individuals with intermediate range TOEIC scores
(approximately 450 – 650). He found that TOEIC scores had
a low correlation (around 0.5) with BULATS scores; a test
of writing in a business context. Finally, an unpublished MA
dissertation (Cunningham, 2002) reported that the TOEIC
was a very poor predictor of communicative competence and
was not at all suitable for measuring gains in communicative
performance. This final paper used a test battery designed by
the author, and while the research should not be discounted,
the fact that the TOEIC was not compared to an established
test needs to be borne in mind. Other authors (Gilfert, 1996;
Eggly et al, 1997; Robb & Ercanbrack, 1999) have also used
TOEIC in research projects but the conclusions they draw
are either unsubstantiated (Gilfert) or not directly related to
the reliability or validity of the TOEIC.
The shortcomings of both the original version of TOEFL
and the current TOEIC were highlighted in the following
quote:
Preoccupation with the psychometric qualities
of TOEFL helps ensure good testing practices.
Nevertheless, it has made the TOEFL somewhat
resistant to and slow in incorporating changes that
might jeopardize its high reliability standards.
Also, the continued commercial success of TOEFL
has contributed to its adherence to the status quo.
Whereas the validity of test scores is undermined
when reliability standards are not upheld,
reliability documentation alone cannot make up
for inadequate validity evidence. In other words,
a strong reliability agenda is not sufficient to
ensure meaningful inferences made from TOEFL
scores. TOEFL’s emphasis on scientific accuracy
through its stringent reliability analyses has been
done with a hazardous disregard for some aspects
of validity. (Chalhoub-Deville. M. & Turner. C.,
2000, p. 536)
ส่วนใหญ่จะต้องมีการประมวลผลประโยคบนอักษร
ความหมาย ระดับ และอาจจะอธิบายที่ดีที่สุดเป็นแบบทดสอบความสามารถทางไวยากรณ์ทั่วไปผ่าน
โหมดด้วยปากเปล่า ( หน้า 216 )
ความคิดเห็นเหล่านี้ต้องได้รับการพิจารณาในแง่ของหลักฐาน
โดยวิจัยกับความเป็นอิสระของข้อมูล .
3 รายงานได้ให้ข้อมูลที่ขัดแย้งกับงานวิจัย ETS
เด็ก ( 1995 ) ที่สำคัญมากของ ติว TOEICข้อมูลอิสระของเขาแสดงให้เห็นว่าค่า
ประมาณโดย ETS จะพูดเกินไป นอกจากนี้เขายังพบว่า
ความคลาดเคลื่อนมาตรฐานของคะแนน TOEIC มากกว่าการตีพิมพ์
ETS รูป , ทำคะแนน TOEIC น้อยที่เชื่อถือได้เป็นวัดความก้าวหน้าของแต่ละบุคคลเช่นไร
คะแนนมักจะเป็นใน SEM
ทดสอบ . ฮิราอิ ( 2545 ) ยังแสดงความสงสัยเกี่ยวกับ
ความสามารถของ TOEIC ทำนายบุคคลการพูดและการเขียน
ภาษาอังกฤษ . ในการศึกษาที่ดำเนินการกับพนักงาน
ของบริษัทใหญ่ของญี่ปุ่น เขาชี้ให้เห็นว่า TOEIC
ยิ่งไม่น่าเชื่อถือ เป็นลักษณะของการพูดภาษาอังกฤษสำหรับบุคคลที่มีช่วงกลาง
( คะแนน TOEIC ประมาณ 450 - 650 ) เขาพบว่า คะแนนสอบ TOEIC ได้
สหสัมพันธ์ต่ำ ( 0.5 ) กับคะแนนสอบ
bulats ;เขียนในบริบททางธุรกิจ ในที่สุด , วิทยานิพนธ์มา
พิมพ์ ( คันนิงแฮม , 2002 ) รายงานว่า TOEIC
เป็นการทำนายที่ยากจนมากของความสามารถในการสื่อสาร และไม่ได้ทั้งหมด
เหมาะสำหรับการวัดประสิทธิภาพการสื่อสารจาก
สุดท้ายกระดาษนี้ใช้ทดสอบแบตเตอรี่ที่ออกแบบโดย
ผู้เขียน และในขณะที่การวิจัยไม่ควรลด
ความจริงที่ว่า TOEIC ไม่ได้เมื่อเทียบกับความต้องการการทดสอบก่อตั้ง
เป็นพาหะในใจ . กรุงเทพฯ ( gilfert , 1996 ;
eggly et al , 1997 ; ร็อบ& ercanbrack , 1999 ) ยังใช้
TOEIC ในโครงการวิจัย แต่ข้อสรุปที่พวกเขาวาด
มีทั้ง unsubstantiated ( gilfert ) หรือที่ไม่เกี่ยวข้องโดยตรงกับ
ความน่าเชื่อถือหรือความถูกต้องของ TOEIC .
ข้อบกพร่องของรุ่นเดิมของโทเฟล
และปัจจุบัน TOEIC ถูกเน้นในใบเสนอราคาดังต่อไปนี้ :
preoccupation ด้วยคุณภาพคุณภาพ
ของ TOEFL ช่วยให้การปฏิบัติการทดสอบที่ดี .
แต่มันทำให้ TOEFL ค่อนข้าง
ป้องกันและช้าในการผสมผสานที่
อาจ jeopardize ของมาตรฐานความน่าเชื่อถือสูง .
นอกจากนี้ ยังคงความสำเร็จเชิงพาณิชย์ของ TOEFL
มีส่วนของการสถานะที่เป็นอยู่
ในขณะที่ความถูกต้องของคะแนนการทดสอบ undermined
เมื่อไม่ยึดถือมาตรฐานความน่าเชื่อถือ , เอกสารเพียงอย่างเดียวไม่สามารถให้ขึ้นค่า
สำหรับเพียงพอพิสูจน์ความถูกต้อง ในคำอื่น ๆที่
วาระความน่าเชื่อถือที่แข็งแกร่งไม่เพียงพอที่จะให้ข้อสรุปมีความหมาย
ทำจากผลคะแนน
TOEFL คือเน้น
ความถูกต้องทางวิทยาศาสตร์ผ่านที่เข้มงวดแบบวิเคราะห์ได้
ทำคำนึงถึงอันตรายในบางแง่มุม
มีผลบังคับใช้ ( chalhoub deville . เมตร &เทอร์เนอร์ C .
2 , 536 )
P
การแปล กรุณารอสักครู่..
