What is test validity and test validation?Tests themselves are not val การแปล - What is test validity and test validation?Tests themselves are not val ไทย วิธีการพูด

What is test validity and test vali

What is test validity and test validation?
Tests themselves are not valid or invalid. Instead, we validate the use of a test score.

Tests are pervasive in our world. Tests can take the form of written responses to a series of questions, such as the paper-and-pencil SAT™, or of judgments by experts about behavior, such as those for gymnastic trials or for a work performance appraisal. The form of test results also vary from pass/fail, to holistic judgments, to a complex series of numbers meant to convey minute differences in behavior.

Regardless of the form a test takes, its most important aspect is how the results are used and the way those results impact individual persons and society as a whole. Tests used for admission to schools or programs or for educational diagnosis not only affect individuals, but also assign value to the content being tested. A test that is perfectly appropriate and useful in one situation may be inappropriate or insufficient in another. For example, a test that may be sufficient for use in educational diagnosis may be completely insufficient for use in determining graduation from high school.

Test validity, or the validation of a test, explicitly means validating the use of a test in a specific context, such as college admission or placement into a course. Therefore, when determining the validity of a test, it is important to study the test results in the setting in which they are used. In the previous example, in order to use the same test for educational diagnosis as for high school graduation, each use would need to be validated separately, even though the same test is used for both purposes.

Validity is a matter of degree, not all or none.

Samuel Messick, a renowned psychometrician, defines validity as "...an integrated evaluative judgment of the degree to which empirical evidence and theoretical rationale support the adequacy and appropriateness of inferences and actions based on test scores and other modes of assessment." Messick points out that validity is a matter of degree, not absolutely valid or absolutely invalid. He advocates that, over time, validity evidence will continue to gather, either enhancing or contradicting previous findings.

Tests sample behavior; they don't measure it directly.

Most, but not all, tests are designed to measure skills, abilities, or traits that are and are not directly observable. For example, scores on the SAT measure developed critical reading, writing and mathematical ability. The score on the SAT that an examinee obtains when he or she takes the test is not a direct measure of critical reading ability, such as degrees centigrade are a direct measure of the heat of an object. The amount of an examinee's developed critical reading ability must be inferred from the examinee's SAT critical reading score.

The process of using a test score as a sample of behavior in order to draw conclusions about a larger domain of behaviors is characteristic of most educational and psychological tests. Responsible test developers and publishers must be able to demonstrate that it is possible to use the sample of behaviors measured by a test to make valid inferences about an examinee's ability to perform tasks that represent the larger domain of interest.

Reliability is not enough; a test must also be valid for its use.

If test scores are to be used to make accurate inferences about an examinee's ability, they must be both reliable and valid. Reliability is a prerequisite for validity and refers to the ability of a test to measure a particular trait or skill consistently. However, tests can be highly reliable and still not be valid for a particular purpose. Crocker and Algina (1986, page 217) demonstrate the difference between reliability and validity with the following analogy.

Consider the analogy of a car's fuel gauge which systematically registers one-quarter higher than the actual level of fuel in the gas tank. If repeated readings are taken under the same conditions, the gauge will yield consistent (reliable) measurements, but the inference about the amount of fuel in the tank is faulty.
This analogy makes it clear that determining the reliability of a test is an important first step, but not the defining step, in determining the validity of a test.

There are many different methods that can be used to establish the validity of a test's use.

Crocker and Algina (1986) point to three major types of validity studies: content validity, criterion-related validity, and construct validity. Recently, consequential validity is increasingly discussed as a fourth major type of validity.

These four types of validity studies include, and sometimes employ, additional concepts of validity. For the content validity of a test, both a face validity and curricular validity study should be completed. To establish criterion-related validity, either a predictive validity or a concurrent validity study can be used. To establish construct validity, convergent validity and/or discriminant validity studies are used. Evidence from content and criterion-related validity studies can also be used to establish construct validity. Consequential validity requires an inquiry into the social consequences of the test use which are unrelated to the construct being tested, but which impact one or more groups.

Several types of evidence should be used to build a case for valid test use. For example, in building a case for the use of the CLEP® exams for college course placement, the college may want to:

•Compare the test specifications with course requirements to see if there is sufficient overlap to be comfortable using evidence from the test in place of completion of a course.
•Complete a concurrent criterion-related validity study to determine the relationship between course grades and test scores.
•Compare results from the CLEP exams with results from classroom tests of the same topics to establish convergent validity evidence.
•Follow up with surveys of the students enrolled in subsequent classes, who tested out of prerequisite classes using CLEP, to determine whether they felt their preparation to be adequate.
Learn more about different types of validity evidence.
0/5000
จาก: -
เป็น: -
ผลลัพธ์ (ไทย) 1: [สำเนา]
คัดลอก!
What is test validity and test validation?
Tests themselves are not valid or invalid. Instead, we validate the use of a test score.

Tests are pervasive in our world. Tests can take the form of written responses to a series of questions, such as the paper-and-pencil SAT™, or of judgments by experts about behavior, such as those for gymnastic trials or for a work performance appraisal. The form of test results also vary from pass/fail, to holistic judgments, to a complex series of numbers meant to convey minute differences in behavior.

Regardless of the form a test takes, its most important aspect is how the results are used and the way those results impact individual persons and society as a whole. Tests used for admission to schools or programs or for educational diagnosis not only affect individuals, but also assign value to the content being tested. A test that is perfectly appropriate and useful in one situation may be inappropriate or insufficient in another. For example, a test that may be sufficient for use in educational diagnosis may be completely insufficient for use in determining graduation from high school.

Test validity, or the validation of a test, explicitly means validating the use of a test in a specific context, such as college admission or placement into a course. Therefore, when determining the validity of a test, it is important to study the test results in the setting in which they are used. In the previous example, in order to use the same test for educational diagnosis as for high school graduation, each use would need to be validated separately, even though the same test is used for both purposes.

Validity is a matter of degree, not all or none.

Samuel Messick, a renowned psychometrician, defines validity as "...an integrated evaluative judgment of the degree to which empirical evidence and theoretical rationale support the adequacy and appropriateness of inferences and actions based on test scores and other modes of assessment." Messick points out that validity is a matter of degree, not absolutely valid or absolutely invalid. He advocates that, over time, validity evidence will continue to gather, either enhancing or contradicting previous findings.

Tests sample behavior; they don't measure it directly.

Most, but not all, tests are designed to measure skills, abilities, or traits that are and are not directly observable. For example, scores on the SAT measure developed critical reading, writing and mathematical ability. The score on the SAT that an examinee obtains when he or she takes the test is not a direct measure of critical reading ability, such as degrees centigrade are a direct measure of the heat of an object. The amount of an examinee's developed critical reading ability must be inferred from the examinee's SAT critical reading score.

The process of using a test score as a sample of behavior in order to draw conclusions about a larger domain of behaviors is characteristic of most educational and psychological tests. Responsible test developers and publishers must be able to demonstrate that it is possible to use the sample of behaviors measured by a test to make valid inferences about an examinee's ability to perform tasks that represent the larger domain of interest.

Reliability is not enough; a test must also be valid for its use.

If test scores are to be used to make accurate inferences about an examinee's ability, they must be both reliable and valid. Reliability is a prerequisite for validity and refers to the ability of a test to measure a particular trait or skill consistently. However, tests can be highly reliable and still not be valid for a particular purpose. Crocker and Algina (1986, page 217) demonstrate the difference between reliability and validity with the following analogy.

Consider the analogy of a car's fuel gauge which systematically registers one-quarter higher than the actual level of fuel in the gas tank. If repeated readings are taken under the same conditions, the gauge will yield consistent (reliable) measurements, but the inference about the amount of fuel in the tank is faulty.
This analogy makes it clear that determining the reliability of a test is an important first step, but not the defining step, in determining the validity of a test.

There are many different methods that can be used to establish the validity of a test's use.

Crocker and Algina (1986) point to three major types of validity studies: content validity, criterion-related validity, and construct validity. Recently, consequential validity is increasingly discussed as a fourth major type of validity.

These four types of validity studies include, and sometimes employ, additional concepts of validity. For the content validity of a test, both a face validity and curricular validity study should be completed. To establish criterion-related validity, either a predictive validity or a concurrent validity study can be used. To establish construct validity, convergent validity and/or discriminant validity studies are used. Evidence from content and criterion-related validity studies can also be used to establish construct validity. Consequential validity requires an inquiry into the social consequences of the test use which are unrelated to the construct being tested, but which impact one or more groups.

Several types of evidence should be used to build a case for valid test use. For example, in building a case for the use of the CLEP® exams for college course placement, the college may want to:

•Compare the test specifications with course requirements to see if there is sufficient overlap to be comfortable using evidence from the test in place of completion of a course.
•Complete a concurrent criterion-related validity study to determine the relationship between course grades and test scores.
•Compare results from the CLEP exams with results from classroom tests of the same topics to establish convergent validity evidence.
•Follow up with surveys of the students enrolled in subsequent classes, who tested out of prerequisite classes using CLEP, to determine whether they felt their preparation to be adequate.
Learn more about different types of validity evidence.
การแปล กรุณารอสักครู่..
ผลลัพธ์ (ไทย) 2:[สำเนา]
คัดลอก!
เป็นความถูกต้องทดสอบอะไรและการตรวจสอบการทดสอบ?
การทดสอบตัวเองไม่ถูกต้องหรือไม่ถูกต้อง แต่เราตรวจสอบการใช้คะแนนการทดสอบ. การทดสอบเป็นที่แพร่หลายในโลกของเรา การทดสอบสามารถใช้รูปแบบของการตอบสนองในการเขียนชุดของคำถามเช่นกระดาษและดินสอ SAT ™หรือตัดสินโดยผู้เชี่ยวชาญเกี่ยวกับพฤติกรรมเช่นนั้นสำหรับการทดลองยิมนาสติกหรือการประเมินผลการปฏิบัติงาน รูปแบบของผลการทดสอบยังแตกต่างจากผ่าน / ไม่ผ่านในการตัดสินแบบองค์รวมเพื่อให้ชุดที่ซับซ้อนของตัวเลขหมายถึงการถ่ายทอดความแตกต่างในพฤติกรรมนาที. โดยไม่คำนึงถึงรูปแบบการทดสอบใช้เวลาที่สำคัญที่สุดของมันเป็นวิธีการที่ผลมีการใช้และ วิธีผลที่ส่งผลกระทบต่อแต่ละบุคคลและสังคมโดยรวม การทดสอบที่ใช้ในการเข้าศึกษาต่อในโรงเรียนหรือโปรแกรมสำหรับการวินิจฉัยหรือการศึกษาไม่เพียง แต่ส่งผลกระทบต่อประชาชน แต่ยังกำหนดค่ากับเนื้อหาที่ถูกทดสอบ การทดสอบที่เหมาะสมเป็นอย่างดีและมีประโยชน์ในสถานการณ์หนึ่งอาจจะไม่เหมาะสมหรือไม่เพียงพอในอีก ยกตัวอย่างเช่นการทดสอบที่อาจจะเพียงพอสำหรับการใช้งานในการวินิจฉัยการศึกษาอาจจะไม่เพียงพอสำหรับการใช้งานอย่างสมบูรณ์ในการพิจารณาจบการศึกษาจากโรงเรียนมัธยม. ความถูกต้องในการทดสอบหรือการตรวจสอบของการทดสอบอย่างชัดเจนหมายถึงการตรวจสอบการใช้งานของการทดสอบในบริบทที่เฉพาะเจาะจง เช่นวิทยาลัยหรือตำแหน่งในการสอนรายวิชา ดังนั้นเมื่อพิจารณาความถูกต้องของการทดสอบเป็นสิ่งสำคัญในการศึกษาผลการทดสอบในการตั้งค่าในการที่พวกเขาจะใช้ ในตัวอย่างก่อนหน้านี้เพื่อที่จะใช้การทดสอบเดียวกันสำหรับการวินิจฉัยการศึกษาสำหรับโรงเรียนมัธยมศึกษาใช้แต่ละคนจะต้องได้รับการตรวจสอบแยกต่างหากถึงแม้ว่าการทดสอบเดียวกันใช้สำหรับวัตถุประสงค์ทั้งสอง. ตั้งแต่วันที่เป็นเรื่องของการศึกษาระดับปริญญาตรีไม่ทั้งหมด หรือไม่มี. ซามูเอลสิค, psychometrician ที่มีชื่อเสียง, กำหนดความถูกต้องว่า "... การตัดสินการประเมินแบบบูรณาการระดับที่หลักฐานเชิงประจักษ์และเหตุผลทางทฤษฎีสนับสนุนความเพียงพอและความเหมาะสมของการหาข้อสรุปและการกระทำขึ้นอยู่กับคะแนนการทดสอบและโหมดอื่น ๆ ของการประเมิน " สิชี้ให้เห็นว่าถูกต้องเป็นเรื่องของการศึกษาระดับปริญญาตรีไม่อย่างถูกต้องหรือไม่ถูกต้องอย่างแน่นอน เขาสนับสนุนว่าเมื่อเวลาผ่านไปหลักฐานความถูกต้องจะยังคงที่จะรวบรวมทั้งการเสริมสร้างความขัดแย้งหรือการค้นพบก่อนหน้านี้. ทดสอบพฤติกรรมตัวอย่าง; พวกเขาไม่ได้วัดได้โดยตรง. ส่วนใหญ่ แต่ไม่ทั้งหมดการทดสอบได้รับการออกแบบมาเพื่อวัดทักษะความสามารถหรือลักษณะที่มีและไม่ได้สังเกตโดยตรง ตัวอย่างเช่นคะแนนในวัด SAT พัฒนาการอ่านเชิงวิเคราะห์การเขียนและความสามารถทางคณิตศาสตร์ คะแนนในการสอบ SAT ที่สอบได้รับเมื่อเขาหรือเธอจะใช้เวลาทดสอบไม่ได้เป็นตัวชี้วัดโดยตรงของความสามารถในการอ่านเชิงวิเคราะห์เช่นองศาเซนติเกรดเป็นวัดโดยตรงจากความร้อนของวัตถุ ปริมาณของของผู้เข้าสอบได้รับการพัฒนาความสามารถในการอ่านที่สำคัญจะต้องมีการสรุปจากคะแนนการอ่านเชิงวิเคราะห์ของสอบ SAT. กระบวนการของการใช้คะแนนการทดสอบเป็นตัวอย่างของพฤติกรรมเพื่อที่จะวาดข้อสรุปเกี่ยวกับโดเมนที่มีขนาดใหญ่ของพฤติกรรมที่เป็นลักษณะของส่วนใหญ่การศึกษาและจิตวิทยา การทดสอบ นักพัฒนาทดสอบที่มีความรับผิดชอบและผู้เผยแพร่จะต้องสามารถแสดงให้เห็นว่ามันเป็นไปได้ที่จะใช้ตัวอย่างของพฤติกรรมที่วัดได้จากการทดสอบที่จะทำให้การหาข้อสรุปที่ถูกต้องเกี่ยวกับความสามารถของผู้เข้าสอบในการปฏิบัติงานที่เป็นตัวแทนของโดเมนขนาดใหญ่ที่น่าสนใจ. ความน่าเชื่อถือไม่เพียงพอ การทดสอบจะต้องมีความถูกต้องสำหรับการใช้งาน. ถ้าคะแนนการทดสอบจะต้องใช้ในการทำข้อสรุปที่ถูกต้องเกี่ยวกับความสามารถในการสอบของพวกเขาจะต้องมีทั้งความน่าเชื่อถือและถูกต้อง ความน่าเชื่อถือเป็นสิ่งที่จำเป็นสำหรับความถูกต้องและหมายถึงความสามารถในการทดสอบการวัดลักษณะเฉพาะหรือทักษะอย่างต่อเนื่อง อย่างไรก็ตามการทดสอบสามารถอย่างน่าเชื่อถือและยังคงไม่ถูกต้องสำหรับวัตถุประสงค์เฉพาะ คร็อกเกอร์และ Algina (1986, หน้า 217) แสดงให้เห็นถึงความแตกต่างระหว่างความน่าเชื่อถือและความถูกต้องที่มีความคล้ายคลึงกันดังต่อไปนี้. พิจารณาความคล้ายคลึงกันของมาตรวัดน้ำมันเชื้อเพลิงของรถซึ่งเป็นระบบการลงทะเบียนหนึ่งในสี่ที่สูงกว่าระดับที่แท้จริงของน้ำมันเชื้อเพลิงในถังก๊าซ ถ้าอ่านซ้ำแล้วซ้ำอีกจะถูกนำภายใต้เงื่อนไขเดียวกันมาตรวัดจะให้ผลที่สอดคล้องกัน (เชื่อถือได้) วัด แต่อนุมานเกี่ยวกับปริมาณของน้ำมันเชื้อเพลิงในถังเป็นความผิดพลาด. การเปรียบเทียบนี้จะทำให้มันชัดเจนว่าการพิจารณาความน่าเชื่อถือของการทดสอบเป็นสิ่งที่สำคัญเป็นครั้งแรก . ขั้นตอน แต่ไม่ขั้นตอนที่กำหนดในการพิจารณาความถูกต้องของการทดสอบ. มีวิธีการที่แตกต่างกันหลายอย่างที่สามารถนำมาใช้เพื่อสร้างความถูกต้องของการใช้การทดสอบที่มีคร็อกเกอร์และ Algina (1986) ชี้ไปที่สามประเภทหลักของการศึกษาความถูกต้อง: เนื้อหา ความถูกต้องความถูกต้องเกณฑ์ที่เกี่ยวข้องและสร้างความถูกต้อง เมื่อเร็ว ๆ นี้เป็นผลสืบเนื่องความถูกต้องมีการกล่าวถึงมากขึ้นเป็นหนึ่งในสี่ประเภทหลักของความถูกต้อง. เหล่านี้สี่ประเภทของการศึกษาความถูกต้องรวมถึงการจ้างงานและบางครั้งแนวคิดเพิ่มเติมของความถูกต้อง สำหรับความตรงตามเนื้อหาของการทดสอบทั้งความถูกต้องใบหน้าและการศึกษาความถูกต้องหลักสูตรควรจะเสร็จสิ้น เพื่อสร้างความถูกต้องเกณฑ์ที่เกี่ยวข้องกับความถูกต้องทั้งการคาดการณ์หรือการศึกษาความถูกต้องพร้อมกันสามารถนำมาใช้ เพื่อสร้างความตรงเชิงโครงสร้างความถูกต้องมาบรรจบกันและ / หรือการศึกษาจำแนกความถูกต้องถูกนำมาใช้ หลักฐานจากเนื้อหาและเกณฑ์ที่เกี่ยวข้องกับการศึกษาความถูกต้องนอกจากนี้ยังสามารถใช้ในการสร้างความตรงเชิงโครงสร้าง ความถูกต้องเป็นผลสืบเนื่องต้องสอบถามรายละเอียดเพิ่มเติมเข้าไปในผลกระทบทางสังคมของการใช้การทดสอบที่มีความเกี่ยวข้องกับการสร้างการทดสอบ แต่ที่ส่งผลกระทบอย่างใดอย่างหนึ่งหรือหลายกลุ่ม. หลายชนิดของหลักฐานที่ควรจะนำมาใช้เพื่อสร้างกรณีสำหรับการใช้งานที่ถูกต้องทดสอบ ยกตัวอย่างเช่นในการสร้างกรณีสำหรับการใช้งานในการสอบที่CLEP®สำหรับตำแหน่งหลักสูตรวิทยาลัยวิทยาลัยอาจต้องการ: •เปรียบเทียบข้อกำหนดการทดสอบกับความต้องการของหลักสูตรเพื่อดูว่ามีการทับซ้อนกันเพียงพอที่จะได้รับความสะดวกโดยใช้หลักฐานจากการทดสอบใน สถานที่ของความสำเร็จของหลักสูตร. •ดำเนินการศึกษาความถูกต้องเกณฑ์ที่เกี่ยวข้องพร้อมกันในการกำหนดความสัมพันธ์ระหว่างเกรดหลักสูตรและคะแนนการทดสอบ. •เปรียบเทียบผลที่ได้จากการสอบ CLEP กับผลลัพธ์ที่ได้จากการทดสอบในห้องเรียนของหัวข้อเดียวกันเพื่อสร้างบรรจบหลักฐานถูกต้อง. • ติดตามกับการสำรวจของนักเรียนเข้าเรียนในชั้นเรียนที่ตามมาที่การทดสอบออกมาจากการเรียนที่จำเป็นต้องใช้ CLEP เพื่อตรวจสอบว่าพวกเขารู้สึกว่าการเตรียมความพร้อมของพวกเขาจะเพียงพอ. เรียนรู้เพิ่มเติมเกี่ยวกับประเภทที่แตกต่างกันของหลักฐานถูกต้อง





































การแปล กรุณารอสักครู่..
ผลลัพธ์ (ไทย) 3:[สำเนา]
คัดลอก!
อะไรคือความถูกต้องและการทดสอบการทดสอบการตรวจสอบ ?
การทดสอบตัวเองจะไม่ถูกต้องหรือไม่ถูกต้อง แทน , เราตรวจสอบการใช้แบบทดสอบคะแนน

สอบแพร่หลายในโลก การทดสอบสามารถใช้รูปแบบของการเขียนตอบชุดคำถาม เช่น กระดาษ และดินสอนั่ง™หรือตัดสินโดยผู้เชี่ยวชาญเกี่ยวกับพฤติกรรม เช่น ยิมนาสติก หรืออื่นๆ สำหรับการปฏิบัติงานเพื่อการประเมินผลรูปแบบของผลการทดสอบยังแตกต่างกันจากผ่าน / ไม่ผ่าน คำตัดสินแบบองค์รวมกับชุดของตัวเลขที่ซับซ้อนหมายถึงการถ่ายทอดพฤติกรรมความแตกต่างนาที

ไม่ว่ารูปแบบการทดสอบที่ใช้ ลักษณะสำคัญของวิธีการใช้และวิธีที่แต่ละคนและผลต่อสังคมโดยรวมใช้แบบทดสอบเพื่อเข้าเรียนโรงเรียนโปรแกรมหรือเพื่อการวินิจฉัย การศึกษาไม่เพียงส่งผลกระทบต่อบุคคล แต่ยังกำหนดมูลค่าให้กับเนื้อหาที่ถูกทดสอบ การทดสอบที่ดีที่สุดที่เหมาะสมและเป็นประโยชน์ในสถานการณ์หนึ่งอาจจะไม่เหมาะสมหรือขาดแคลน ในอีก ตัวอย่างเช่นการทดสอบที่อาจจะเพียงพอสำหรับใช้ในการวินิจฉัย การศึกษาอาจจะสมบูรณ์เพียงพอสำหรับใช้ในการจบการศึกษาจากโรงเรียนมัธยม

ทดสอบความเที่ยงตรงหรือความตรงของแบบทดสอบ โดยการใช้วิธีการทดสอบในบริบทที่เฉพาะเจาะจง เช่น วิทยาลัยเข้าหรือจัดวางลงในหลักสูตร ดังนั้น เมื่อพิจารณาความตรงของแบบทดสอบมันเป็นสิ่งสำคัญเพื่อศึกษาผลการทดสอบในการตั้งค่าที่พวกเขาจะใช้ ในตัวอย่างก่อนหน้านี้ เพื่อใช้ทดสอบเดียวกันเพื่อการวินิจฉัย การศึกษาเมื่อเรียนจบแต่ละใช้จะต้องมีการตรวจสอบแยกต่างหาก แม้ว่าการทดสอบเดียวกันจะใช้สำหรับวัตถุประสงค์ทั้งสอง

ความถูกต้องเป็นเรื่องขององศา ไม่หมด หรือ ไม่มี

ซามูเอลเมซิก , psychometrician ชื่อดังกำหนดความถูกต้อง " . . . . . . . แบบประเมินการตัดสินใจของระดับที่หลักฐานเชิงประจักษ์และทฤษฎี เหตุผลสนับสนุนเพียงพอ และความเหมาะสมในการใช้ และการกระทำตามคะแนนสอบ และ โหมดอื่น ๆของการประเมิน " เมซิกจุดที่ใช้ตรวจสอบเรื่องขององศา ไม่ใช่อย่างที่ถูกต้องหรืออย่างไม่ถูกต้อง เขาสนับสนุนว่า ช่วงเวลาหลักฐานความถูกต้องจะยังคงรวบรวมทั้งการส่งเสริมหรือขัดแย้งก่อนหน้านี้พบ

การทดสอบตัวอย่างพฤติกรรม ; พวกเขาไม่ได้วัดโดยตรง

ส่วนใหญ่ แต่ไม่ทั้งหมด การทดสอบถูกออกแบบมาเพื่อวัดทักษะความสามารถหรือคุณลักษณะที่เป็นและไม่ได้เป็นที่สังเกตได้โดยตรง ตัวอย่างเช่น คะแนน SAT วัดพัฒนา การอ่าน การเขียน และความสามารถทางคณิตศาสตร์คะแนนสอบ SAT ที่ได้รับเมื่อเขาหรือเธอจะใช้เวลาทดสอบไม่ได้วัดโดยตรงของความสามารถในการอ่านอย่างมีวิจารณญาณ เช่น องศาเซนติเกรดเป็นวัดโดยตรงของความร้อนของวัตถุ ปริมาณของผู้สอบสามารถพัฒนาความสามารถการอ่านอย่างมีวิจารณญาณ ต้องอนุมานเอาจากบ่งนั่งคะแนนการอ่าน

กระบวนการของการใช้คะแนนสอบเป็นตัวอย่างของพฤติกรรม เพื่อหาข้อสรุปเกี่ยวกับโดเมนขนาดใหญ่ของพฤติกรรมที่เป็นลักษณะของการทดสอบทางการศึกษามากที่สุด และทางด้านจิตใจนักพัฒนาทดสอบผู้รับผิดชอบและผู้เผยแพร่จะต้องสามารถแสดงให้เห็นว่ามันเป็นไปได้ที่จะใช้ตัวอย่างของพฤติกรรมที่วัดโดยการทดสอบเพื่อให้ข้อสรุปที่ถูกต้องเกี่ยวกับบ่งการความสามารถในการปฏิบัติงานที่แสดงขนาดใหญ่โดเมนที่น่าสนใจ

ความน่าเชื่อถือไม่เพียงพอ การทดสอบจะต้องมีอายุการใช้งาน .

ถ้าคะแนนสอบจะถูกใช้เพื่อให้ข้อสรุปที่ถูกต้องเกี่ยวกับความสามารถของผู้สอบ จะต้องมีทั้งเชื่อถือได้และถูกต้อง ความน่าเชื่อถือเป็นสิ่งจำเป็นเพื่อความถูกต้องและหมายถึงความสามารถของการทดสอบเพื่อวัดคุณลักษณะเฉพาะหรือทักษะอย่างต่อเนื่อง อย่างไรก็ตามการทดสอบสามารถถือสูงและยังไม่สามารถใช้ได้สำหรับวัตถุประสงค์เฉพาะ คร็อกเกอร์ และ algina ( 1986 ,หน้า 217 ) แสดงให้เห็นถึงความแตกต่างระหว่างความน่าเชื่อถือและความเที่ยงตรงกับคล้ายคลึง ดังต่อไปนี้

พิจารณาความคล้ายคลึงกันของรถยนต์เชื้อเพลิงวัดซึ่งเป็นระบบทะเบียนปีสูงกว่าจริงระดับน้ำมันเชื้อเพลิงในถังก๊าซ ถ้าอ่านซ้ำอยู่ภายใต้เงื่อนไขเดียวกัน มาตรวัดจะให้ผลที่สอดคล้องกัน ( ที่เชื่อถือได้ ) การวัดผลแต่การอนุมานเกี่ยวกับปริมาณของน้ำมันเชื้อเพลิงในถังมันเสีย
เปรียบเทียบนี้จะทําให้มันชัดเจนว่าการพิจารณาความน่าเชื่อถือของการทดสอบเป็นขั้นตอนแรกที่สำคัญ แต่ไม่ใช่การกำหนดขั้นตอนในการกำหนดความถูกต้องของการทดสอบ .

มีหลายวิธีที่แตกต่างกันที่สามารถใช้เพื่อสร้างความถูกต้องของการใช้

ของการทดสอบคร็อกเกอร์ และ algina ( 1986 ) จุดสามประเภทหลักของความถูกต้องศึกษาความตรงตามเนื้อหาความตรงตามเกณฑ์สัมพันธ์และสร้างความ เมื่อเร็วๆ นี้ เป็นผลสืบเนื่องมาจากความถูกต้องมากขึ้นได้เป็นประเภทหลักที่สี่ของความถูกต้อง

เหล่านี้สี่ประเภทของความถูกต้องการศึกษารวม และบางครั้งใช้แนวคิดเพิ่มเติมมีผลบังคับใช้ สำหรับความเที่ยงตรงเชิงเนื้อหาของแบบทดสอบทั้งใบหน้าและศึกษาความตรงตามหลักสูตรที่ควรจะเสร็จสมบูรณ์ สร้างความตรงตามเกณฑ์สัมพันธ์ ไม่ว่าจะเป็นอาหารหรือศึกษาความตรงตามสภาพ สามารถใช้ เพื่อสร้างสร้างความถูกต้องความตรงลู่เข้า และ / หรือ ศึกษาจำแนกตามการใช้ หลักฐานจากเนื้อหา และความตรงตามเกณฑ์สัมพันธ์การศึกษายังสามารถใช้เพื่อสร้าง สร้าง ความที่สำคัญต้องมีการสอบสวนผลกระทบเชิงสังคมของการทดสอบใช้งานที่ไม่เกี่ยวข้องกับการสร้างที่ถูกทดสอบ แต่ซึ่งส่งผลกระทบต่อหนึ่งหรือมากกว่าหนึ่งกลุ่ม

หลายประเภทของหลักฐานที่ควรจะใช้ในการสร้างกรณีทดสอบที่ถูกต้องใช้ ตัวอย่างเช่น ในการสร้างกรณีสำหรับการใช้® CLEP สอบสำหรับตำแหน่งวิทยาลัย วิทยาลัยอาจต้องการ :

- เปรียบเทียบข้อมูลทดสอบกับความต้องการของหลักสูตร เพื่อดูว่ามีเหลื่อมเพียงพอที่จะสบายโดยใช้หลักฐานจากการทดสอบในสถานที่ของความสมบูรณ์ของหลักสูตร .
- สมบูรณ์เกณฑ์พร้อมกันที่เกี่ยวข้องการศึกษาความตรงเพื่อตรวจสอบความสัมพันธ์ระหว่างเกรดและคะแนนสอบ
- เปรียบเทียบผลลัพธ์จาก CLEP สอบกับผลจากแบบทดสอบในชั้นเรียนในหัวข้อเดียวกันเพื่อสร้างการตรวจสอบหลักฐาน
- ขึ้นตามการสำรวจของนักศึกษาที่ลงทะเบียนเรียนในชั้นเรียน ภายหลังที่ได้ทดสอบในชั้นเรียนมีการใช้ CLEP เพื่อตรวจสอบว่าพวกเขารู้สึกว่าพวกเขาเตรียมจะเพียงพอ .
เรียนรู้เพิ่มเติมเกี่ยวกับชนิดที่แตกต่างกันของหลักฐาน
ถูกต้อง
การแปล กรุณารอสักครู่..
 
ภาษาอื่น ๆ
การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.

Copyright ©2024 I Love Translation. All reserved.

E-mail: