7.1. Discussion of results
At first sight, our results do not seem to differ much from the
results reported by Fraley and Vazire (2014) in the field of personality
and social psychology. Fraley and Vazire report their
overall NF-5 to be 104, whereas we found ours to be 114. However,
the picture looks less favourable when analysing sample sizes
separately for different designs. The NF-5 for experimental studies
in our sample is 40, with an interquartile range from 24 to 72. This
means that 50% of all sport psychological experiments published in
sport psychology's most prestigious journals between 2009 and
2013 had sample sizes of 40 participants or less, and 25% of all
published experiments even had less than 24 participants. Correlational
studies, on the other hand, had larger sample sizes. The NF-
5 for correlational studies was 221, which is close to the 250 participants
recommended by Schonbrodt and Perugini (2013) € . On the
other hand it is important to note that researchers sometimes
divide their overall sample into sub-samples (e.g., when assessing a
correlation separately for women and men). In this case, the sample
is reduced to 50% of its original size, meaning that the statistical
power for detecting an effect is reduced accordingly.
Following from the argument that sample sizes are an important
ingredient of quality research as these determine statistical power
of a test, we further reported statistical power for a range of typical
population effects (see Table 11). Given the reported sample sizes
and corresponding power results for the field of sport and exercise
psychology, the implications seem to differ according to which
design the study employed. While the correlational studies and the
experimental studies employing mixed designs were rather
adequately powered, this was not the case for quasi-experimental
studies and experimental studies employing within-groups and
between-groups designs. Correlational studies probably had larger
samples because they are oftentimes more economical as they
require little more than distributing pencil-and-paper questionnaires,
rendering it easier to sample larger numbers of participants,
whereas, experimental studies are often a lot more tedious. However,
from a statistical point of view all study designs need to be
identically powered to achieve the goals of high quality research:
(a) producing precise effect size estimates; (b) producing literature
with low false-positive rates; and (c) producing replicable findings
(Fraley & Vazire, 2014).
Once researchers start to emphasize reproducibility and precise
estimations of effects, small samples may be problematic even
when they have sufficient power from a NHST perspective. This is
because they lead to imprecise estimations of effect sizes (e.g.,
Cumming, 2012; Gelman & Carlin, 2014; Schonbrodt € & Perugini,
2013). Recommendations for planning sample sizes may differ
depending on whether they focus on power for NHST or whether
they focus on precision for effect size estimations (e.g., Cumming,
2014; Schonbrodt € & Perugini, 2013). For example, Schonbrodt and €
Perugini (2013, p. 611) estimate sample sizes necessary for determining
the effect size of a correlation with a minimum level of
tolerated fluctuations. They conclude that “… for typical research
scenarios reasonable trade-offs between accuracy and confidence
start to be achieved when n approaches 250”.
So far, we have always referred to sample sizes and power while
assuming that researchers want to detect a certain effect. However,
sometimes researchers want to show that a certain effect does not
exist. For example, researchers might state that the interpretation
of a certain result is only meaningful when there is no betweengroups
difference related to another factor. Crucially, in order for
this reasoning to be valid, the study needs the power to detect the
second effect in the first place. According to this rationale, a study
should not exclusively be powered to detect the principal effect of
interest, but instead it should be planned to have the power to
detect the smallest effect that is necessary for its interpretation to
be valid. For example, when researchers base the interpretation of a
mixed-design study on the between-participants factor not being
significant, then the power related to the between-participants
factor matters as much as the power related to the withinparticipants
factor.
7.1 การอภิปรายของผลที่เห็นครั้งแรก, ผลของเราดูเหมือนจะไม่แตกต่างกันมากจากผลการรายงานโดยFraley และ Vazire (2014) ในด้านของบุคลิกภาพและจิตวิทยาสังคม Fraley และ Vazire รายงานของพวกเขาโดยรวมNF-5 จะเป็น 104, ในขณะที่เราพบว่าเราจะเป็น 114 แต่ภาพดูดีน้อยเมื่อวิเคราะห์ขนาดตัวอย่างแยกต่างหากสำหรับการออกแบบที่แตกต่างกัน อิท-5 สำหรับการศึกษาทดลองในตัวอย่างของเราคือ40, มีช่วง interquartile จาก 24 ถึง 72 นี้หมายความว่า50% ของการเล่นกีฬาการทดลองทางจิตวิทยาที่ตีพิมพ์ในจิตวิทยากีฬาของวารสารที่มีชื่อเสียงที่สุดระหว่างปี2009 และ2013 มีขนาดตัวอย่าง 40 เข้าร่วมหรือ น้อยกว่าและ 25% ของการทดลองที่ตีพิมพ์ยังมีน้อยกว่า24 คน หาความสัมพันธ์การศึกษาในมืออื่น ๆ ที่มีขนาดใหญ่ขนาดตัวอย่าง NF- 5 สำหรับการศึกษาหาความสัมพันธ์เป็น 221 ซึ่งอยู่ใกล้กับ 250 ผู้เข้าร่วมที่แนะนำโดยSchonbrodt และ Perugini (2013) € ในทางกลับกันมันเป็นสิ่งสำคัญที่จะทราบว่าบางครั้งนักวิจัยแบ่งกลุ่มตัวอย่างโดยรวมของพวกเขาเป็นตัวอย่างย่อย(เช่นเมื่อประเมินความสัมพันธ์แยกต่างหากสำหรับผู้หญิงและผู้ชาย) ในกรณีนี้ตัวอย่างจะลดลงถึง 50% ของขนาดเดิมหมายความว่าสถิติการใช้พลังงานสำหรับการตรวจสอบผลกระทบจะลดลงตาม. ต่อไปนี้จากอาร์กิวเมนต์ที่ขนาดตัวอย่างที่สำคัญส่วนผสมของการวิจัยที่มีคุณภาพเช่นนี้กำหนดอำนาจทางสถิติของการทดสอบเรายังรายงานอำนาจทางสถิติสำหรับช่วงของทั่วไปผลกระทบประชากร (ดูตารางที่ 11) ที่กำหนดขนาดตัวอย่างรายงานและผลที่สอดคล้องกันสำหรับการใช้พลังงานด้านการกีฬาและการออกกำลังกายจิตวิทยาความหมายดูเหมือนจะแตกต่างกันตามที่การออกแบบการศึกษาการจ้างงาน ในขณะที่การศึกษาหาความสัมพันธ์และการศึกษาการจ้างออกแบบการทดลองผสมค่อนข้างถูกขับเคลื่อนอย่างเพียงพอกรณีนี้ไม่ได้สำหรับกึ่งทดลองการศึกษาและการศึกษาทดลองการจ้างงานภายในกลุ่มและระหว่างกลุ่มการออกแบบ การศึกษาหาความสัมพันธ์อาจจะมีขนาดใหญ่ตัวอย่างเพราะพวกเขามักจะประหยัดมากขึ้นขณะที่พวกเขาจำเป็นต้องมีน้อยกว่าแจกแบบสอบถามดินสอและกระดาษ, การกระทำมันง่ายที่จะลิ้มลองตัวเลขขนาดใหญ่ของผู้เข้าร่วมในขณะที่การศึกษาการทดลองมักจะมีจำนวนมากที่น่าเบื่อมากขึ้น แต่จากจุดทางสถิติในมุมมองของการออกแบบการศึกษาทั้งหมดจะต้องมีการขับเคลื่อนกันเพื่อให้บรรลุเป้าหมายของการวิจัยที่มีคุณภาพสูง: (ก) การผลิตการประมาณการขนาดของผลที่แม่นยำ; (ข) การผลิตวรรณกรรมที่มีอัตราการเท็จบวกต่ำ; และ (ค) ผลการวิจัยการผลิตการจำลองแบบ(Fraley และ Vazire 2014). เมื่อนักวิจัยเริ่มต้นที่จะเน้นการทำสำเนาและแม่นยำประมาณการของผลกระทบที่กลุ่มตัวอย่างขนาดเล็กอาจจะมีปัญหาแม้กระทั่งเมื่อพวกเขามีอำนาจเพียงพอจากมุมมองNHST นี้เป็นเพราะพวกเขานำไปสู่การประมาณการแน่ชัดขนาดผล(เช่นคัมมิง, 2012; Gelman และคาร์ล 2014; Schonbrodt €และ Perugini, 2013) คำแนะนำสำหรับการขนาดตัวอย่างการวางแผนอาจแตกต่างกันขึ้นอยู่กับว่าพวกเขามุ่งเน้นพลังงานสำหรับ NHST หรือไม่ว่าพวกเขาจะมุ่งเน้นไปที่ความแม่นยำในการประมาณการขนาดของผลกระทบ(เช่นคัมมิง, 2014; Schonbrodt €และ Perugini 2013) ยกตัวอย่างเช่น Schonbrodt และ€ Perugini (2013, น. 611) ประมาณการขนาดตัวอย่างที่จำเป็นสำหรับการกำหนดขนาดของผลกระทบของความสัมพันธ์กับระดับต่ำสุดของความผันผวนของการยอมรับ พวกเขาสรุปว่า "... สำหรับการวิจัยโดยทั่วไปสถานการณ์ไม่ชอบการค้าที่เหมาะสมระหว่างความถูกต้องและความเชื่อมั่นเริ่มต้นที่จะเกิดขึ้นได้เมื่อn เข้าใกล้ 250". จนถึงขณะนี้เราได้เรียกเสมอที่จะลิ้มลองขนาดและการใช้พลังงานในขณะที่สมมติว่านักวิจัยต้องการที่จะตรวจสอบผลบางอย่าง แต่บางครั้งนักวิจัยต้องการที่จะแสดงให้เห็นว่าผลบางอย่างไม่ได้อยู่ ยกตัวอย่างเช่นนักวิจัยอาจระบุว่าการตีความของผลบางอย่างที่มีความหมายเฉพาะเมื่อไม่มี betweengroups ความแตกต่างที่เกี่ยวข้องกับปัจจัยอื่น ขับเคลื่อนเพื่อให้เหตุผลนี้จะต้องศึกษาความต้องการอำนาจในการตรวจสอบที่มีผลที่สองในสถานที่แรก ตามเหตุผลนี้การศึกษาไม่ควรถูกขับเคลื่อนโดยเฉพาะในการตรวจสอบผลกระทบที่สำคัญของความสนใจแต่มันควรจะวางแผนที่จะมีอำนาจในการตรวจสอบผลกระทบน้อยที่สุดที่เป็นสิ่งจำเป็นสำหรับการตีความที่จะมีผลบังคับใช้ ตัวอย่างเช่นเมื่อนักวิจัยฐานความหมายของการศึกษาการออกแบบที่ผสมในระหว่างเข้าร่วมปัจจัยไม่ได้อย่างมีนัยสำคัญแล้วอำนาจที่เกี่ยวข้องกับการมีส่วนร่วมระหว่างปัจจัยเรื่องมากที่สุดเท่าที่อำนาจที่เกี่ยวข้องกับการwithinparticipants ปัจจัย
การแปล กรุณารอสักครู่..
