created by randomization, regarding known and unknown
characteristics of the participants that may be associated with
treatment effectiveness. Hence, treatment groups remain
comparable and the effect of the intervention can be assessed
independently from these characteristics [16].
All of the 29 studies evaluated for this report clearly
described the statistical methods used and the majority offered
sufficient power (greater than .80) to detect large and moderate
effect sizes. Few studies, however, had sufficient power to
detect small effects[14,15,26,32,49]. Of the 12 studies that did
not find a significant difference between the intervention and
the control, only 1 (8.3%) had enough power to detect a small
difference [26]. The main factors affecting power are sample
size and the population effect size and outcome measurement
reliability. Power increases as reliability increases because of
corresponding reductions in random error in statistical tests
[51]. It is recommended that researchers (1) calculate the
sample size needed to detect weak, medium, and strong effects
(as per the selected statistical test for treatment effects); (2)
offer reasoned estimates of the expected effect size (e.g., based
on prior similar research); (3) strive to achieve the critical
sample size needed to detect the expected effect size at α = .05
and β = .20 (i.e., power = .80); and (4) ensure that their
outcome measures are as reliable as practically feasible. These
calculations and rationales should be included in the study
report to offer a suitable context for the reader in judging the
merits of the study as a source of generalizable knowledge.
Detecting small effects may not be feasible in many
studies because it may require the assessment of hundreds or
thousands of participants. In addition to meta-analyses,
researchers have suggested that pooling data across studies
[52] or conducting multicenter studies [3] may be beneficial
for addressing the power issue. Simple pooling of data,
however, is susceptible to the Simpson's paradox, the
reversal of the treatment effect observed in the individual
studies [53]. On an individual basis, however, researchers
studying child disaster interventions, like all researchers,
struggle with the dilemma of how to cost-effectively detect
meaningful differences in a particular study. Meaningful
differences can involve changes in two standard deviations,
reductions from the diagnostic range to the non-diagnostic
range (i.e., “caseness”), reductions beyond the confidence
interval for expected change, or a 25% reduction in
presenting problems.
4.5. Clinically significant and meaningful results
Establishing statistically significant results in intervention
studies is insufficient in assessing their benefit; outcomes
related to an intervention also must be meaningful. For
example, in their study of refugee children from war-torn
countries, Ehntholt and colleagues [54] noted that while
those receiving an eclectic cognitive behavioral intervention
showed statistically significant better outcomes compared to
a waitlist control, the improvements were clinically modest
and were not maintained at follow-up. Additionally, the
สร้าง โดยสุ่ม เกี่ยวกับรู้จักและไม่รู้จักลักษณะของผู้เข้าร่วมที่อาจเกี่ยวข้องกับรักษาประสิทธิผล ดังนั้น กลุ่มรักษาอยู่เปรียบเทียบได้ และสามารถประเมินผลของการแทรกแซงอิสระจากลักษณะเหล่านี้ [16]ทั้งหมดของการศึกษา 29 ประเมินรายงานนี้อย่างชัดเจนอธิบายวิธีการทางสถิติที่ใช้ และส่วนใหญ่เสนอพลังงานเพียงพอ (มากกว่า.80) เพื่อตรวจหาขนาดใหญ่ และปานกลางขนาดของผล ศึกษาน้อย อย่างไรก็ตาม มีอำนาจเพียงพอในการตรวจสอบผลเล็ก [14,15,26,32,49] การศึกษา 12 ที่ไม่พบความแตกต่างที่สำคัญระหว่างการแทรกแซง และควบคุม เพียง 1 (8.3%) มีประสิทธิภาพเพียงพอในการตรวจสอบขนาดเล็กความแตกต่าง [26] ปัจจัยหลักที่ส่งผลกระทบต่ออำนาจนั้นตัวอย่างขนาดและผลการวัดผลของประชากรและขนาดความน่าเชื่อถือ พลังงานเพิ่มขึ้นเป็นความน่าเชื่อถือเพิ่มขึ้นเนื่องจากการลดข้อผิดพลาดแบบสุ่มในการทดสอบทางสถิติที่สอดคล้องกัน[51] แนะนำว่า นักวิจัย (1) คำนวณการขนาดตัวอย่างที่ต้องการตรวจสอบอ่อนแอ ปานกลาง และผลกระทบที่แข็งแกร่ง(ตามการเลือกสถิติทดสอบสำหรับผลการรักษา); (2)นำเสนอประมาณการและขนาดผลที่คาดไว้ (เช่น คะแนนก่อนคล้ายวิจัย); (3) มุ่งความสำคัญตัวอย่างขนาดที่ต้องการตรวจสอบขนาดคาดผลที่α =.05และβ =.20 (เช่น ไฟ =. 80); และ (4) ให้แน่ใจว่าพวกเขามาตรวัดผลลัพธ์น่าเชื่อถือเป็นเป็นไปได้จริง เหล่านี้การคำนวณและสิ้นสุดควรรวมอยู่ในการศึกษารายงานเพื่อนำเสนอในบริบทที่เหมาะสมสำหรับผู้อ่านในการตัดสินการข้อดีของการศึกษาเป็นแหล่งความรู้ generalizableผลตรวจจับขนาดเล็กอาจไม่สามารถกระทำในหลายศึกษาเนื่องจากมันอาจต้องใช้การประเมินหลายร้อย หรือหลายพันของผู้เข้าร่วม นอกจาก meta-วิเคราะห์นักวิจัยได้แนะนำข้อมูลการทำพูลเก็บนั้นผ่านการศึกษา[52] หรือทำ multicenter ศึกษา [3] อาจจะเป็นประโยชน์จัดการปัญหาพลังงาน ร่วมกันที่เรียบง่ายของข้อมูลอย่างไรก็ตาม เป็น paradox ของซิมป์สัน ไวต่อการกลับรายการของผลปฏิบัติในแต่ละบุคคลการศึกษา [53] สำหรับแต่ละรายการ อย่างไรก็ตาม นักวิจัยเรียนเด็กภัยแทรกแซง เช่นนักวิจัยทั้งหมดต่อสู้กับของวิธีการประหยัดค่าใช้จ่ายตรวจสอบความแตกต่างที่มีความหมายในการศึกษาเฉพาะ มีความหมายความแตกต่างสามารถเกี่ยวข้องกับการเปลี่ยนแปลงในสองส่วนเบี่ยงเบนมาตรฐานลดลงจากช่วงวินิจฉัยให้การวินิจฉัยไม่ช่วง (เช่น, "caseness"), ลดนอกเหนือจากความมั่นใจช่วงที่คาดไว้หรือการเปลี่ยนแปลง ลด 25%นำเสนอปัญหา4.5 ผลทางคลินิกที่สำคัญ และมีความหมายการกำหนดนัยสำคัญทางสถิติผลการแทรกแซงการศึกษาไม่เพียงพอในการประเมินประโยชน์ของพวกเขา ผลที่ได้การแทรกแซงยังต้องมีความหมาย สำหรับตัวอย่าง ในการศึกษาของเด็กผู้ลี้ภัยจากสงครามประเทศ Ehntholt และเพื่อนร่วมงาน [54] ในขณะที่จดบันทึกไว้ผู้ที่ได้รับการแทรกแซงพฤติกรรมทางปัญญาผสมผสานแสดงให้เห็นผลลัพธ์ที่ดีกว่าอย่างมีนัยสำคัญทางสถิติเมื่อเทียบกับควบคุมการจัด การปรับปรุงถูกทางคลินิกเจียมเนื้อเจียมตัวและถูกเก็บรักษาไว้ที่ติดตามไม่ นอกจากนี้ การ
การแปล กรุณารอสักครู่..

ที่สร้างขึ้นโดยการสุ่ม เรื่องที่รู้จักและไม่รู้จักคุณลักษณะของผู้เรียนที่อาจเกี่ยวข้องกับประสิทธิผลของการรักษา ดังนั้น กลุ่มยังคงอยู่เทียบเท่า และผลกระทบของการแทรกแซงสามารถประเมินเป็นอิสระจากคุณลักษณะพวกนี้ [ 16 ]ทั้งหมด 29 การศึกษาการประเมินรายงานเรื่องนี้ให้ชัดเจนอธิบายวิธีการทางสถิติที่ใช้และส่วนใหญ่เสนอพลังงานพอเพียง ( มากกว่า 80 ) เพื่อตรวจหาขนาดใหญ่และปานกลางขนาดผล การศึกษาน้อย อย่างไรก็ตาม มีอำนาจเพียงพอตรวจจับขนาดเล็กผล [ 14,15,26,32,49 ] ของ 12 การศึกษาที่ทำไม่พบความแตกต่างอย่างมีนัยสำคัญระหว่างการแทรกแซงและการควบคุมเพียง 1 ( 8.3% ) มีอำนาจพอที่จะตรวจสอบขนาดเล็กความแตกต่าง [ 26 ] ปัจจัยที่มีผลต่อการใช้พลังงานตัวอย่างขนาดและประชากร การวัดผล ผลขนาดความน่าเชื่อถือ พลังเพิ่มขึ้นเมื่อเพิ่มความน่าเชื่อถือ เพราะที่สอดคล้องกันซึ่งความคลาดเคลื่อนในการทดสอบทางสถิติ[ 51 ] ขอแนะนําว่า นักวิจัย ( 1 ) คำนวณขนาดตัวอย่างที่ต้องการตรวจ อ่อน , กลาง , และผลกระทบที่แข็งแกร่ง( ตามสถิติที่ทดสอบผลการรักษา ) ; ( 2 )เสนอเหตุผลการประเมิน ผลที่คาดหวัง ( เช่น ตามขนาดงานวิจัยที่คล้ายกันก่อนที่ ) ; ( 3 ) มุ่งมั่นที่จะบรรลุอย่างมีวิจารณญาณขนาดตัวอย่างที่ต้องการตรวจ ผลที่คาดหวังขนาดα = . 05และ บีตา = 20 ( เช่น พลังงาน = . 80 ) ; และ ( 4 ) ให้แน่ใจว่า พวกเขาการวัดผลจะเป็นที่เชื่อถือได้เป็นจริงไปได้ เหล่านี้การคํานวณ และมีเหตุผลที่ควรจะรวมอยู่ในการศึกษารายงานเสนอบริบทเหมาะสมสำหรับผู้อ่านในการตัดสินประโยชน์ของการศึกษาเป็นแหล่งความรู้ generalizable .การตรวจสอบผลขนาดเล็กอาจไม่สามารถเป็นไปได้มากการศึกษาเพราะมันอาจต้องมีการประเมินหลายร้อยหรือพันของผู้เข้าร่วม นอกจากนี้จะโดยวิธีการวิเคราะห์เมต้า ,นักวิจัยได้พบว่าข้อมูลในการศึกษา[ 52 ] หรือดำเนินการสหศาสตร์ [ 3 ] อาจเป็นประโยชน์เพื่อเรียกพลังออก ที่ง่ายรวมข้อมูลอย่างไรก็ตาม มีความไวต่อซิมป์สัน พาราด็อกซ์ ,ความผกผันของการรักษาผลการตรวจสอบในแต่ละการศึกษา [ 53 ] บนพื้นฐานของแต่ละบุคคล อย่างไรก็ตาม นักวิจัยการศึกษาการแทรกแซงภัยเด็ก เช่นนักวิจัยการต่อสู้กับภาวะที่กลืนไม่เข้าคายไม่ออกของวิธีการต้นทุนอย่างมีประสิทธิภาพ ตรวจหาความแตกต่างของความหมายในการศึกษาโดยเฉพาะ ความหมายความแตกต่างที่สามารถเกี่ยวข้องกับการเปลี่ยนแปลงในส่วนเบี่ยงเบนมาตรฐานลดจากช่วงการวินิจฉัยจะไม่วินิจฉัยช่วง ( เช่น " caseness " ) ซึ่งนอกจากความมั่นใจจำนวนที่คาดว่าจะเปลี่ยนแปลง หรือ 25% การลดลงในการนำเสนอปัญหา4.5 . ผลลัพธ์ทางคลินิกที่สำคัญและมีความหมายการสร้างผลลัพธ์ในการทดลองอย่างมีนัยสำคัญทางสถิติการศึกษาไม่เพียงพอในการประเมินผลประโยชน์ของตนที่เกี่ยวข้องกับการแทรกแซงยังต้องมีความหมาย สำหรับตัวอย่างในการศึกษาของเด็กผู้ลี้ภัยจากสงครามฉีกขาดประเทศ ehntholt และเพื่อนร่วมงาน [ 54 ] กล่าวว่าในขณะที่ผู้ที่ได้รับการผสมผสานความรู้ความเข้าใจเกี่ยวกับพฤติกรรมการแทรกแซงแสดงผลอย่างมีนัยสำคัญดีกว่าเมื่อเทียบกับเป็น waitlist ควบคุมการปรับปรุงเป็นเจียมเนื้อเจียมตัว ทางการแพทย์และไม่ได้รักษาที่ติดตาม นอกจากนี้
การแปล กรุณารอสักครู่..
