Validity refers to how well a test

Validity refers to how well a test measures what it is purported to measure.

Why is it necessary?

While reliability is necessary, it alone is not sufficient. For a test to be reliable, it also needs to be valid. For example, if your scale is off by 5 lbs, it reads your weight every day with an excess of 5lbs. The scale is reliable because it consistently reports the same weight every day, but it is not valid because it adds 5lbs to your true weight. It is not a valid measure of your weight.

Types of Validity

1. Face Validity ascertains that the measure appears to be assessing the intended construct under study. The stakeholders can easily assess face validity. Although this is not a very “scientific” type of validity, it may be an essential component in enlisting motivation of stakeholders. If the stakeholders do not believe the measure is an accurate assessment of the ability, they may become disengaged with the task.

Example: If a measure of art appreciation is created all of the items should be related to the different components and types of art. If the questions are regarding historical time periods, with no reference to any artistic movement, stakeholders may not be motivated to give their best effort or invest in this measure because they do not believe it is a true assessment of art appreciation.

2. Construct Validity is used to ensure that the measure is actually measure what it is intended to measure (i.e. the construct), and not other variables. Using a panel of “experts” familiar with the construct is a way in which this type of validity can be assessed. The experts can examine the items and decide what that specific item is intended to measure. Students can be involved in this process to obtain their feedback.

Example: A women’s studies program may design a cumulative assessment of learning throughout the major. The questions are written with complicated wording and phrasing. This can cause the test inadvertently becoming a test of reading comprehension, rather than a test of women’s studies. It is important that the measure is actually assessing the intended construct, rather than an extraneous factor.

Validity refers to how well a test measures what it is purported to measure.

Why is it necessary?

While reliability is necessary, it alone is not sufficient. For a test to be reliable, it also needs to be valid. For example, if your scale is off by 5 lbs, it reads your weight every day with an excess of 5lbs. The scale is reliable because it consistently reports the same weight every day, but it is not valid because it adds 5lbs to your true weight. It is not a valid measure of your weight.

Types of Validity

1. Face Validity ascertains that the measure appears to be assessing the intended construct under study. The stakeholders can easily assess face validity. Although this is not a very “scientific” type of validity, it may be an essential component in enlisting motivation of stakeholders. If the stakeholders do not believe the measure is an accurate assessment of the ability, they may become disengaged with the task.

Example: If a measure of art appreciation is created all of the items should be related to the different components and types of art. If the questions are regarding historical time periods, with no reference to any artistic movement, stakeholders may not be motivated to give their best effort or invest in this measure because they do not believe it is a true assessment of art appreciation.

2. Construct Validity is used to ensure that the measure is actually measure what it is intended to measure (i.e. the construct), and not other variables. Using a panel of “experts” familiar with the construct is a way in which this type of validity can be assessed. The experts can examine the items and decide what that specific item is intended to measure. Students can be involved in this process to obtain their feedback.

Example: A women’s studies program may design a cumulative assessment of learning throughout the major. The questions are written with complicated wording and phrasing. This can cause the test inadvertently becoming a test of reading comprehension, rather than a test of women’s studies. It is important that the measure is actually assessing the intended construct, rather than an extraneous factor.

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

มีผลบังคับใช้ถึงวิธีการที่ดีการทดสอบมาตรการที่เจตนาวัด เหตุใดจึงจำเป็นหรือไม่ในขณะที่ความน่าเชื่อถือเป็นสิ่งจำเป็น มันเพียงอย่างเดียวไม่เพียงพอ สำหรับการทดสอบเพื่อให้เชื่อถือได้ มันยังต้องถูกต้อง ตัวอย่าง ถ้าขนาดของคุณถูกปิด โดย 5 ปอนด์ ก็อ่านน้ำหนักของคุณทุกวันมากเกิน 5 ปอนด์ มาตราส่วนเป็นความน่าเชื่อถือ เพราะเรารายงานน้ำหนักเดียวกันทุกวัน แต่ไม่ถูกต้องเนื่องจากจะเพิ่ม 5 ปอนด์ของน้ำหนักจริง ไม่มีการวัดน้ำหนักของคุณถูกต้อง ชนิดที่มีผลบังคับใช้ 1. มีผลบังคับใช้ใบหน้า ascertains ว่า วัดที่ปรากฏ สามารถประเมินโครงสร้างที่กำหนดไว้ภายใต้การศึกษา มีส่วนได้เสียสามารถได้ประเมินตั้งแต่ใบหน้า แม้ว่านี้ไม่ใช่ชนิดมาก "ทางวิทยาศาสตร์" มีผลบังคับใช้ มันอาจเป็นส่วนประกอบสำคัญในไทยของเสีย ถ้าเสียเชื่อการวัดเป็นการประเมินความถูกต้อง พวกเขาอาจเป็น disengaged กับภารกิจ ตัวอย่าง: ถ้ามีสร้างวัดเพิ่มศิลปะ รายการทั้งหมดควรจะเกี่ยวข้องกับส่วนประกอบต่าง ๆ และชนิดของศิลปะ ถ้าคำถามเกี่ยวข้องระยะเวลาประวัติศาสตร์ ไม่อ้างอิงการเคลื่อนไหวใด ๆ ศิลปะ เสียได้แรงจูงใจเพื่อให้ความพยายามของพวกเขา หรือลงทุนในวัดนี้ เพราะไม่เชื่อจึงประเมินจริงของศิลปะขึ้น 2. ใช้เพื่อให้แน่ใจว่า วัดได้จริงวัดมีผลบังคับใช้โครงสร้างวัตถุประสงค์เพื่อวัด (เช่นการก่อสร้าง), และตัวแปรอื่น ๆ ไม่ ใช้แผงของ "ผู้เชี่ยวชาญ" คุ้นเคยกับโครงสร้างเป็นวิธีสามารถประเมินชนิดนี้มีผลบังคับใช้ ผู้เชี่ยวชาญสามารถตรวจสอบสินค้า และเลือกสินค้าเฉพาะที่มีวัตถุประสงค์เพื่อวัดการ นักเรียนสามารถมีส่วนร่วมในกระบวนการนี้จะได้รับผลป้อนกลับของ ตัวอย่าง: โปรแกรมการศึกษาของสตรีอาจออกแบบการประเมินสะสมการเรียนรู้ตลอดหลักการ คำถามจะเขียน ด้วยข้อความที่ซับซ้อนและใช้วลี ซึ่งสามารถทำให้การทดสอบเป็น การทดสอบความเข้าใจในการอ่านโดยไม่ได้ตั้งใจ แทนการทดสอบศึกษาของผู้หญิง เป็นสิ่งสำคัญที่วัดได้จริงประเมินโครงสร้างวัตถุประสงค์ แทนที่เป็นปัจจัยที่ไม่เกี่ยวข้อง

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

ตั้งแต่วันที่หมายถึงวิธีการที่ดีการทดสอบวัดสิ่งที่มันเป็นเจตนาที่จะวัด. ทำไมมันจำเป็น? ในขณะที่ความน่าเชื่อถือเป็นสิ่งที่จำเป็นมันคนเดียวไม่เพียงพอ สำหรับการทดสอบที่จะเชื่อถือได้ก็ยังจะต้องถูกต้อง ตัวอย่างเช่นถ้าขนาดของคุณออก 5 ปอนด์อ่านน้ำหนักของคุณทุกวันด้วยส่วนที่เกินจาก 5 £ ขนาดมีความน่าเชื่อถือเพราะรายงานอย่างต่อเนื่องน้ำหนักเดียวกันทุกวัน แต่มันเป็นสิ่งที่ไม่ถูกต้องเพราะมันเพิ่ม 5 £น้ำหนักที่แท้จริงของคุณ มันไม่ได้เป็นตัวชี้วัดที่ถูกต้องของน้ำหนักของคุณ. ประเภทของการตั้งแต่วันที่1 ตั้งแต่วันที่ใบหน้า ascertains ว่ามาตรการดูเหมือนจะประเมินตั้งใจสร้างภายใต้การศึกษา ผู้มีส่วนได้เสียสามารถประเมินความถูกต้องใบหน้า แม้ว่าจะไม่ได้เป็นอย่างมาก "วิทยาศาสตร์" ประเภทของความถูกต้องก็อาจจะเป็นองค์ประกอบที่สำคัญในการสมัครเป็นแรงจูงใจของผู้มีส่วนได้ส่วนเสีย หากผู้มีส่วนได้เสียไม่เชื่อว่ามาตรการที่เป็นความถูกต้องของการประเมินความสามารถในการที่พวกเขาอาจจะกลายเป็น disengaged กับงาน. ตัวอย่าง: หากตัวชี้วัดของการแข็งค่าของศิลปะจะถูกสร้างขึ้นทั้งหมดของรายการที่ควรจะเกี่ยวข้องกับองค์ประกอบที่แตกต่างกันและประเภทของศิลปะ หากคำถามจะเกี่ยวกับช่วงเวลาทางประวัติศาสตร์ที่มีการอ้างอิงถึงการเคลื่อนไหวทางศิลปะใด ๆ ผู้มีส่วนได้เสียอาจจะไม่เป็นแรงจูงใจที่จะให้ความพยายามของพวกเขาที่ดีที่สุดหรือลงทุนในวัดนี้เพราะพวกเขาไม่เชื่อว่ามันคือการประเมินที่แท้จริงของการแข็งค่าของศิลปะ. 2 สร้างตั้งแต่วันที่ถูกนำมาใช้เพื่อให้แน่ใจว่ามาตรการที่เป็นจริงวัดสิ่งที่มันมีจุดมุ่งหมายในการวัด (เช่นสร้าง) และตัวแปรอื่น ๆ ไม่ได้ การใช้แผงของ "ผู้เชี่ยวชาญ" คุ้นเคยกับการสร้างเป็นวิธีการที่ถูกต้องตามกฎหมายของประเภทนี้สามารถประเมิน ผู้เชี่ยวชาญสามารถตรวจสอบรายการและตัดสินใจเลือกสิ่งที่รายการเฉพาะที่มีจุดมุ่งหมายในการวัด นักเรียนสามารถมีส่วนร่วมในกระบวนการนี้จะได้รับการตอบรับของพวกเขา. ตัวอย่าง: โปรแกรมการศึกษาของผู้หญิงอาจออกแบบการประเมินผลการเรียนรู้ที่สะสมของตลอดที่สำคัญ คำถามจะถูกเขียนด้วยถ้อยคำที่ซับซ้อนและใช้ถ้อยคำ นี้อาจทำให้เกิดการทดสอบโดยไม่ได้ตั้งใจที่จะกลายเป็นทดสอบความเข้าใจในการอ่านมากกว่าการทดสอบการศึกษาของผู้หญิง มันเป็นสิ่งสำคัญที่ชี้วัดที่เป็นจริงการประเมินสร้างตั้งใจมากกว่าปัจจัยภายนอก

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

ความถูกต้องหมายถึงอย่างไรดีทดสอบมาตรการอะไรมันมีจุดมุ่งหมายเพื่อวัด

ทำไมมันจำเป็น ?

ในขณะที่ความเชื่อมั่นเป็นสิ่งจำเป็น มันเพียงอย่างเดียวยังไม่เพียงพอ สำหรับการทดสอบที่สามารถเชื่อถือได้ มันก็ต้องใช้ได้ ตัวอย่างเช่น ถ้าขนาดของคุณจะปิดโดย 5 ปอนด์ อ่านน้ำหนักของคุณทุกวันกับเกิน 5 £ ขนาดมีความน่าเชื่อถือเพราะมันอย่างสม่ำเสมอรายงานน้ำหนักเดียวกันทุกวันแต่มันไม่ถูกต้องเพราะเพิ่ม 5 £น้ำหนักที่แท้จริงของคุณ มันไม่ได้วัดที่ถูกต้องของน้ำหนักของคุณ .

ตามประเภทของ 1 หน้าวัด ascertains ว่าวัดจะสร้างวัดไว้ศึกษา ผู้มีส่วนได้เสียสามารถประเมินหน้าความ แม้ว่านี้ไม่ได้เป็น " วิทยาศาสตร์ " ประเภทของความถูกต้องมันอาจเป็นองค์ประกอบที่สำคัญในการเป็นแรงจูงใจของผู้มีส่วนได้เสีย ถ้าผู้มีส่วนได้เสียไม่เชื่อว่ามาตรการการประเมินความถูกต้องของความสามารถที่พวกเขาอาจกลายเป็นอิสระกับงาน

ตัวอย่าง : หากวัดคุณค่าศิลปะถูกสร้างขึ้นทั้งหมดของรายการที่ควรจะเกี่ยวข้องกับองค์ประกอบที่แตกต่างกันและประเภทของศิลปะ ถ้าคำถามเกี่ยวกับช่วงเวลาในประวัติศาสตร์โดยไม่มีการอ้างอิงใด ๆ ศิลปะเคลื่อนไหว , ผู้มีส่วนได้เสียอาจไม่สามารถกระตุ้นให้ความพยายามที่ดีที่สุดของพวกเขาหรือลงทุนในวัดนี้เพราะพวกเขาไม่เชื่อว่ามันคือการประเมินที่แท้จริงของศิลปนิยม .

2 ความตรงเชิงโครงสร้างของแบบทดสอบที่ใช้เพื่อให้แน่ใจว่า วัดเป็นวัดที่มีวัตถุประสงค์เพื่อวัด ( เช่นสร้าง ) และตัวแปรอื่น ๆใช้แผงของ " ผู้เชี่ยวชาญ " ที่คุ้นเคยกับการสร้างเป็นวิธีที่ถูกต้องชนิดนี้สามารถประเมิน ผู้เชี่ยวชาญสามารถตรวจสอบรายการและตัดสินใจอะไรที่เฉพาะเจาะจง รายการ มีวัตถุประสงค์เพื่อวัด นักเรียนสามารถมีส่วนร่วมในกระบวนการนี้ เพื่อรับฟังความคิดเห็นของพวกเขา .

ตัวอย่าง : สตรีศึกษาโปรแกรมอาจออกแบบการประเมินการเรียนรู้สะสมตลอดหลักคำถามที่เขียนด้วยถ้อยคำที่ซับซ้อนและเนื้อเพลง . นี้สามารถทำให้เกิดการทดสอบโดยไม่ได้ตั้งใจเป็นแบบทดสอบความเข้าใจในการอ่าน มากกว่าการทดสอบของการศึกษาของผู้หญิง มันเป็นสิ่งสำคัญว่าวัดเป็นจริงการประเมินวัตถุประสงค์สร้างมากกว่า

เป็นปัจจัยที่ไม่เกี่ยวข้อง

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.