Measures of the Magnitude of DIF (E

Measures of the Magnitude of DIF (Effect size)
Two points are noteworthy at this juncture. First, as per usual in statistical
hypothesis testing, the test statistic should accompanied by some measure of the
magnitude of the effect. This is necessary because small sample sizes can hide interesting
statistical effects whereas large sample sizes (like the ones found in typical psychometric
studies) can point to statistically significant findings where the effect is quite small and
meaningless (Kirk, 1996). Second, I endorse the advice of Zumbo and Hubley (1998)
who urge researchers to report effect sizes for both statistically significant and for
statistically non-significant results. Following this practice, with time the psychometric
community will have amassed an archive of effects for both statistically significant and
Theory and Methods of DIF 27
non-significant DIF and therefore we can eventually move away from the somewhat
arbitrary standards set by Cohen (1992).
Measuring the magnitude of DIF follows, as it should, the same strategy as the
statistical hypothesis testing except that one only works with the R-squared values at each
step. Zumbo and Thomas (1997) indicate that an examination of both the 2-df Chi-square
test (of the likelihood ratio statistics) in logistic regression and a measure of effect size is
needed to identify DIF. Without an examination of effect size, trivial effects could be
statistically significant when the DIF test is based on a large sample size (i.e., too much
statistical power). The Zumbo-Thomas measure of effect size for R2 parallels effect size
measures available for other statistics (see Cohen, 1992).
For an item to be classified as displaying DIF, the two-degree-of-freedom Chisquared
test in logistic regression had to have had a p-value less than or equal to 0.01 (set
at this level because of the multiple hypotheses tested) and the Zumbo-Thomas effect size
measure had to be at least an R-squared of 0.130. Pope (1997) has applied a similar
criterion to binary personality items. It should be noted that Gierl and his colleagues
(Gierl & McEwen, 1998, Gierl, Rogers, and Klinger, 1999) have adopted a more
conservative criteria (i.e., the requisite R-squared for DIF is smaller) for the Zumbo-
Thomas effect size in the context of educational measurement. They have also shown
that the Zumbo-Thomas effect size measure is correlated with other DIF techniques like
the Mantel-Haenszel and SIBTEST hence lending validity to the method.
In summary, I have found that a useful practice is to compute the R-squared effect
for both (a) uniform DIF, and (b) a simultaneous test of uniform and non-uniform DIF.
This strategy is useful because one is able to take advantage of the hierarchical nature of
DIF modeling and therefore compare the R-squared for uniform DIF with the
simultaneous uniform and non-uniform DIF to gage a sense of the magnitude or nonuniform
DIF. The examples will demonstrate this approach.

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

มาตรการของขนาด DIF (ผลขนาด)สองจุดสำคัญที่นี้ juncture ครั้งแรก ตามปกติในทางสถิติการทดสอบสมมติฐาน การทดสอบสถิติควรมาพร้อมกับวัดบางขนาดของผล จำเป็นเนื่องจากขนาดตัวอย่างขนาดเล็กสามารถซ่อนที่น่าสนใจผลทางสถิติในขณะที่ตัวอย่างขนาดใหญ่ (เช่นคนที่พบทั่วไปในไซโครเมทริกส์ศึกษา) สามารถชี้ไปที่ค้นพบที่สำคัญทางสถิติซึ่งผลที่ได้คือค่อนข้างเล็ก และความหมาย (Kirk, 1996) ที่สอง ฉันรับรองคำแนะนำของ Zumbo และ Hubley (1998)ที่กระตุ้นให้นักวิจัยรายงานผลขนาด สำหรับทั้งสองอย่างมีนัยสำคัญทางสถิติ และผลทางสถิติไม่ใช่นัยสำคัญ ต่อการปฏิบัตินี้ กับเวลาในไซโครเมทริกส์ชุมชนจะได้ไว้เก็บผลสำหรับทั้งสองอย่างมีนัยสำคัญทางสถิติ และทฤษฎีและวิธีการของ DIF 27ไม่สำคัญ DIF และดังนั้นเราสามารถย้ายจากค่อนข้างกำหนดมาตรฐานที่กำหนด โดยโคเฮน (1992)การวัดขนาดของ DIF ดังนี้ ตามที่ควร ยุทธศาสตร์เดียวกันยกเว้นว่าหนึ่งทำงานเฉพาะกับ R squared ค่าแต่ละการทดสอบสมมติฐานทางสถิติขั้นตอนการ Zumbo และ Thomas (1997) ระบุว่า การตรวจสอบทั้งไคสแควร์ 2 dfทดสอบ (จากสถิติอัตราส่วนโอกาส) ในการถดถอยโลจิสติกและการวัดผลขนาดไม่จำเป็นต้องระบุ DIF. โดยไม่มีการตรวจสอบขนาดของผลกระทบ ผลกระทบเล็กน้อยอาจจะนัยสำคัญทางสถิติเมื่อทดสอบ DIF ตามขนาดตัวอย่างขนาดใหญ่ (เช่น มากเกินไปพลังทางสถิติ) วัด Zumbo โทมัสขนาดผลสำหรับแนว R2 ผลขนาดมาตรการสำหรับสถิติอื่น ๆ (ดูโคเฮน 1992)สำหรับสินค้าที่จัดประเภทเป็น DIF, Chisquared สององศาของเสรีภาพในการแสดงทดสอบในการถดถอยโลจิสติกจะมีค่า p น้อยกว่า หรือเท่ากับ 0.01 (ชุดในระดับนี้เนื่องจากสมมติฐานหลายทดสอบ) และขนาดผล Zumbo โทมัสวัดก็จะเป็นน้อย R-squared ของ 0.130 สมเด็จพระสันตะปาปา (1997) ได้ใช้การคล้ายเกณฑ์บุคลิกภาพไบนารีรายการ มันควรจะตั้งข้อสังเกตว่า Gierl และเพื่อนร่วมงานของเขา(Gierl & McEwen, 1998, Gierl โรเจอร์ และ Klinger, 1999) ได้นำมาใช้มากขึ้นเกณฑ์การอนุรักษ์ (เช่น สแบน squared R สำหรับ DIF มีขนาดเล็ก) สำหรับ Zumbo -โทมัสขนาดผลในบริบทของการศึกษาวัด พวกเขายังได้แสดงว่า Zumbo โทมัสผลวัดขนาดมีความสัมพันธ์กับเทคนิคอื่น ๆ DIF เช่นHaenszel หิ้งและ SIBTEST จึง ให้ยืมมีผลบังคับใช้เป็นวิธีการในสรุป ได้พบว่า การปฏิบัติที่เป็นประโยชน์คือการ คำนวณผล R squared(ก) เครื่องแบบ DIF และ (ข) การทดสอบพร้อมกันของ DIF. สม่ำเสมอ และไม่สม่ำเสมอกลยุทธ์นี้มีประโยชน์เนื่องจากสามารถใช้ประโยชน์จากธรรมชาติของลำดับชั้นสร้างโมเดล DIF และดังนั้นจึง เปรียบเทียบ R squared สำหรับ DIF เหมือนกันกับการDIF กันสม่ำเสมอ และไม่สม่ำเสมอให้ความรู้สึกของขนาดหรือ nonuniform-gageDIF. ตัวอย่างจะสาธิตวิธีการนี้

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

มาตรการของขนาดของ DIF (ผลขนาด) เดอะ
สองจุดที่น่าสังเกตในช่วงหัวเลี้ยวหัวต่อนี้ ครั้งแรกตามปกติในทางสถิติ
ทดสอบสมมติฐานสถิติทดสอบควรมาพร้อมกับวัดบาง
ขนาดของผลกระทบ นี้เป็นสิ่งจำเป็นเพราะขนาดกลุ่มตัวอย่างขนาดเล็กสามารถซ่อนที่น่าสนใจ
ผลกระทบทางสถิติในขณะที่ขนาดตัวอย่างขนาดใหญ่ (เช่นคนที่พบในทางจิตวิทยาทั่วไป
การศึกษา) สามารถชี้ไปที่ผลการวิจัยอย่างมีนัยสำคัญที่มีผลกระทบที่ค่อนข้างเล็กและ
ความหมาย (เคิร์ก, 1996) ประการที่สองผมรับรองคำแนะนำของ Zumbo และ Hubley (1998) เดอะ
ที่กระตุ้นให้นักวิจัยที่จะรายงานผลขนาดสำหรับทั้งนัยสำคัญทางสถิติและ
ผลทางสถิติที่ไม่ใช่อย่างมีนัยสำคัญ ต่อไปนี้การปฏิบัตินี้กับเวลาที่ทางจิตวิทยา
ชุมชนจะมี amassed เก็บของผลกระทบของทั้งสองอย่างมีนัยสำคัญและ
ทฤษฎีและวิธีการ DIF 27
DIF ไม่ใช่อย่างมีนัยสำคัญและดังนั้นในที่สุดเราก็สามารถย้ายออกไปจากที่ค่อนข้าง
มาตรฐานที่กำหนดโดยพลโคเฮน (1992)
การวัดขนาดของ DIF ดังต่อไปนี้ตามที่มันควรจะเป็นกลยุทธ์เดียวกับ
การทดสอบสมมติฐานทางสถิติยกเว้นว่าหนึ่งจะทำงานเฉพาะกับค่า R-Squared ในแต่ละ
ขั้นตอน Zumbo และโทมัส (1997) แสดงให้เห็นว่าการตรวจสอบของทั้ง 2 DF Chi-square
test (สถิติอัตราส่วนความเป็นไปได้) ในการถดถอยโลจิสติกและการวัดขนาดของผลกระทบที่จะ
จำเป็นในการระบุ DIF โดยไม่ต้องสอบขนาดมีผลผลกระทบเล็กน้อยอาจจะมี
นัยสำคัญทางสถิติเมื่อทดสอบ DIF จะขึ้นอยู่กับขนาดของกลุ่มตัวอย่างขนาดใหญ่ (เช่นมากเกินไป
อำนาจสถิติ) Zumbo-Thomas วัดขนาดมีผลสำหรับ R2 แนวขนาดของผล
มาตรการใช้ได้สำหรับสถิติอื่น ๆ (ดูโคเฮน, 1992)
สำหรับรายการที่จะจัดเป็นแสดง DIF ทั้งสององศาของเสรีภาพ Chisquared
ทดสอบการถดถอยโลจิสติกจะต้องมี p-value น้อยกว่าหรือเท่ากับ 0.01 (ชุด
ที่ระดับเพราะสมมติฐานหลายการทดสอบนี้) และ Zumbo-Thomas ขนาดของผล
การวัดจะต้องมีอย่างน้อย R-squared ของ 0.130 สมเด็จพระสันตะปาปา (1997) ได้ใช้คล้าย
เกณฑ์ไปยังรายการบุคลิกภาพไบนารี มันควรจะตั้งข้อสังเกตว่า Gierl และเพื่อนร่วมงานของเขา
(Gierl & ประทีป 1998 Gierl โรเจอร์สและ Klinger, 1999) ได้รับการยอมรับมากขึ้น
เกณฑ์อนุรักษ์นิยม (เช่นจำเป็น R-Squared สำหรับ DIF มีขนาดเล็ก) สำหรับ Zumbo-
โทมัสมีผลบังคับใช้ ขนาดในบริบทของการวัดการศึกษา พวกเขาได้แสดงให้เห็น
ว่ามาตรการ Zumbo-Thomas ขนาดของผลมีความสัมพันธ์กับเทคนิคอื่น ๆ เช่น DIF
หิ้ง-Haenszel และซิบเทสท์จึงให้ยืมความถูกต้องกับวิธีการ
ในการสรุปฉันได้พบว่ามีการปฏิบัติที่เป็นประโยชน์ในการคำนวณผล R-Squared
สำหรับทั้ง (ก) เครื่องแบบ DIF และ (ข) การทดสอบพร้อมกันของเครื่องแบบและนอกเครื่องแบบ DIF
กลยุทธ์นี้เป็นประโยชน์เพราะใครสามารถที่จะใช้ประโยชน์จากธรรมชาติลำดับชั้นของ
DIF การสร้างแบบจำลองและดังนั้นจึงเปรียบเทียบ R-Squared สำหรับ DIF ฟอร์มกับ
เครื่องแบบพร้อมกันและนอกเครื่องแบบ DIF เพื่อประกันความรู้สึกของขนาดหรือไม่สม่ำเสมอ
DIF ตัวอย่างที่จะแสดงให้เห็นวิธีการนี้

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.