4. DISCUSSION
One limitation of this research was the variation in the participation rate each semester, as noted in Section 2.1. The researcher was the instructor and assessor for the unit described here, and therefore it was considered essential that students should have no opportunity to suspect that their grade could be influenced by their agreement or lack of agreement to participate. Ethics approval was granted only on the conditions that the researcher had no knowledge of who participated until after the students had received their grades, and that another person handed out and collected any materials that related to the research. As a result, it is not known why there was such variation in the participation rate from one semester to another and it was not possible to ask.
Even with these constraints the researcher believes that this study showed that using a combination of teaching methods other than that of didactic teaching will help in students’ understanding of p-values. It is believed that the improvement is due to no single strategy, but rather the combination of computer simulation, writing about mathematics, finding a way to make the unfamiliar familiar, and relating the Null Hypothesis Test to Popper's ideas of the scientific method.
Computer simulation allowed students to "discover" some of the statistical principles for themselves. In particular, the "query first, answer later" method introduced an element of surprise into their statistical learning and increased students’ interest. Such simulations would have been tedious before the introduction of spreadsheet programs such as Excel. It is the ability of such spreadsheets to “resample” and to recalculate statistics such as the mean for a large number of cases instantaneously that makes these spreadsheets so valuable. There are numerous examples of easy to use simulations to develop understanding of statistical concepts on the internet that do not require the setting up of the simulations in Microsoft Excel, but this program was used for all the simulation for reasons explained in the Introduction. The applet developed at the University of Auckland is particularly useful as it shows the individual points in the sample, then calculates the mean and places this value on a number line. Two other simulations are also useful because although they do not show the individual sample point, they show the distribution of the means for differing population distributions, and are easily adjusted for different sample sizes. These are the simulations from the computer-Assisted Statistics textbooks (http://cast. Massev.ac.nz/collection_public.html) and from Learning by Simulations
The students appeared to find the connection between Popper's ideas of falsification and the writing of null hypotheses interesting, it was clear that some students had not been previously exposed to questions a what makes a scientific proof, and therefore had not considered that repeated observations do not prove scientific statements. With Popper's suggestions in mind, students were able to write null hypotheses more intentionally, instead of just by rote.
Some considerable time was spent the researcher investigating how to make the probabilistic, hypothetical thinking involved in NHT easier to understand; to make the unfamiliar familiar. The discovery of the s hot outside" problem from Shaugnessy and Chance (2005) was considered a breakthrough. The students easily understood this problem and, in general, could use this problem as a template for their later work where p-values were involved. It gave them a simple problem to understand that formed a basis for their later work as it became more complex.
The representation of the hypothesis tests in visual form (Figure 1) enabled students to make connections between the probability distribution, what sample statistics would be likely given the population parameter, the likelihood of the test statistic given the parameter, and the numberical result for the p-value
At the end of the study there were still difficulties with students trying to learn a rule and then misapplying it; this has also been noted by Chance, delMas and Garfield (2004). These students stated that if the p-value is below 0.05, then the null hypothesis is not rejected. Another misconception was that the p-value is the probability of being incorrect (also observed by Gliner, Leech, & Morgan, 2002). In addition, there was one other misconception that was partly correct, that the p-value gives the probability of the observation. This is a simpler interpretation than the correct definition of the p-value, and appears to make sense to the students.
The most persistent and common misconception was that the p-value is the probability that the null hypothesis is true. This misconception has also been observed by Gliner, Leech and Morgan (2002). Once the instructor realised that some students had this misconception, she informed them of their error. This latter strategy, however, appeared to make no difference. This is a simpler interpretation than the correct definition of the p-value and appears to make sense to the students with the result it is tenaciously held. This misconception demonstrates that students may be interpreting new material in the light of what they already know, even if it is not accurate. To make conceptual change takes effort, and students will not make this effort unless they see a good reason to do so (Posner, Strike, Hewson, & Gertzog, 1982). Therefore instructors need to be aware of the possible misconceptions students may develop and produce teaching and learning activities to avoid these occurring.
From an instructor's viewpoint, the use of computer simulation appeared to result in students being more engaged in their work and being able to understand some areas of statistics that had been difficult with previous methods of instruction. The element of surprise in the result of the simulation to introduce the Central Limit Theorem resulted in students being much more likely to remember that sample means form a normal distribution. After an exercise in linear regression where the “errors” were simulated the students appeared to cope much more easily with the idea that there can be a non-significant relationship between the variables even when there is a non-zero gradient. Because the students had become familiar with visual representations of p-values, the students also had little difficulty in coming to terms with the principles of Type and Type ll errors, and the idea that a distribution of the “true” situation may overlap with the distribution of the proposed situation. The questions on the test that asked students to explain the consequence of a Type 1 error in a particular context were usually done well.
This study provides a basis for developing instruction to assist in students' understanding of p- values. It also suggests possibly fruitful areas for further research, such as why students come to believe that the p-value is the probability of the null hypothesis being true.
4 . การอภิปราย
ข้อจำกัดหนึ่งของงานวิจัยนี้ คือ การเปลี่ยนแปลงในอัตราการมีส่วนร่วมในแต่ละภาคการศึกษา ตามที่ระบุไว้ในมาตรา ๑ . ผู้วิจัยเป็นผู้สอน และประเมินสำหรับหน่วยที่อธิบายที่นี่ , และดังนั้นจึงเป็นสิ่งจำเป็นที่ควรจะมีก็ไม่มีโอกาสที่จะสงสัยว่าเกรดของพวกเขาอาจได้รับอิทธิพลจากข้อตกลงหรือการขาดข้อตกลงร่วมของพวกเขาได้รับการอนุมัติจริยธรรมเท่านั้น ในเงื่อนไขที่ผู้วิจัยมีความรู้ที่ได้รับหลังจากนักเรียนได้รับเกรดของตนเอง และบุคคลอื่น แจกและเก็บรวบรวมวัสดุใด ๆที่เกี่ยวข้องกับงานวิจัย ผล มันไม่ได้เป็นที่รู้จักกันว่าทำไมมีเช่นการเปลี่ยนแปลงในอัตราการมีส่วนร่วมจากภาคอื่น และมันเป็นไปไม่ได้ที่จะถาม
แม้จะมีข้อจำกัดเหล่านี้ ผู้วิจัยเชื่อว่า การศึกษานี้แสดงให้เห็นว่าการใช้การรวมกันของวิธีการสอนอื่นนอกเหนือจากที่สอนคำสอนจะช่วยในความเข้าใจของนักเรียน p-values . มันคือเชื่อว่า การปรับปรุงเนื่องจากไม่มีกลยุทธ์เดียว แต่การรวมกันของการจำลองทางคอมพิวเตอร์ การเขียนเกี่ยวกับคณิตศาสตร์หาวิธีที่จะทำให้ไม่คุ้นเคย คุ้นเคย และมีความสัมพันธ์กับการทดสอบสมมติฐานโมฆะการตกใจของความคิดของวิธีการทางวิทยาศาสตร์ .
คอมพิวเตอร์อนุญาตให้นักเรียน " ค้นพบ " บางส่วนของหลักการทางสถิติสำหรับตัวเอง โดยเฉพาะ " คำถามแรกตอบทีหลัง " วิธีแนะนำองค์ประกอบของความประหลาดใจในการเรียน สถิติที่ใช้ในการวิเคราะห์ของพวกเขาและความสนใจที่เพิ่มขึ้นของนักเรียนการจำลองสถานการณ์ดังกล่าวจะได้รับน่าเบื่อ ก่อนการแนะนำของสเปรดชีตโปรแกรมเช่น Excel มันคือความสามารถของเช่นสเปรดชีต " resample " และคำนวณสถิติเช่นค่าเฉลี่ยสำหรับจำนวนขนาดใหญ่ของกรณีทันทีทำให้สเปรดชีตเหล่านี้มีค่ามากมีตัวอย่างมากมายที่ง่ายต่อการใช้แบบจำลองเพื่อพัฒนาความเข้าใจของแนวคิดทางสถิติบนอินเทอร์เน็ตที่ไม่ต้องมีการตั้งค่าของจำลองใน Microsoft Excel แต่โปรแกรมนี้ใช้สำหรับการจำลองสำหรับเหตุผลที่อธิบายได้ในเบื้องต้นแอพเพล็ตพัฒนาขึ้นที่มหาวิทยาลัยโอ๊คแลนด์ เป็นประโยชน์อย่างยิ่ง มันแสดงให้เห็นจุดแต่ละตัวอย่าง แล้วคำนวณหาค่าเฉลี่ย และสถานที่นี้ค่าหมายเลขบรรทัด จำลองสองอื่น ๆยังมีประโยชน์เพราะถึงแม้ว่าพวกเขาไม่ได้แสดงตัวอย่างจุดแต่ละ พวกเขาแสดงการกระจายของประชากรหมายถึงการแตกต่างได้อย่างง่ายดายและมีการปรับขนาดของกลุ่มตัวอย่างที่แตกต่างกัน เหล่านี้คือผลจากบทเรียนคอมพิวเตอร์ สถิติ โยนหนังสือเรียน ( http / / : . massev . ac.nz / collection_public . html ) และจากการเรียนรู้โดยจำลอง
นักเรียนปรากฏว่าพบการเชื่อมต่อระหว่างปอปเปอร์คือความคิดของการโกหกและการเขียนของโมฆะสมมติฐานที่น่าสนใจมันชัดเจนว่า นักเรียนบางคนยังไม่เคยสัมผัสกับคำถามเป็นสิ่งที่ทำให้หลักฐานทางวิทยาศาสตร์ และดังนั้น จึงไม่รู้ว่าซ้ำ สังเกตไม่ได้พิสูจน์งบทางวิทยาศาสตร์ ด้วยคำแนะนำของประหลาดในใจ นักเรียนสามารถเขียนสมมติฐานว่าง ตั้งใจ แทนที่จะเป็นแค่การท่องจำ
บางมากเวลาที่ใช้ผู้วิจัยตรวจสอบวิธีการสร้างความน่าจะเป็นนะคิดเกี่ยวข้องกับ nht ง่ายต่อการเข้าใจ ทำให้ไม่คุ้นเคยคุ้นเคย การค้นพบของ s ร้อนภายนอก " ปัญหาจาก shaugnessy และโอกาส ( 2005 ) มีการพิจารณาความคืบหน้า นักเรียนสามารถเข้าใจปัญหานี้และในทั่วไปปัญหานี้สามารถใช้เป็นแม่แบบสำหรับการทำงานในภายหลังของพวกเขาที่ p-values มีส่วนเกี่ยวข้องด้วย มันทำให้พวกเขามีปัญหาได้ง่าย ที่จะเข้าใจรูปแบบพื้นฐานสำหรับการทำงานในภายหลังของพวกเขาได้กลายเป็นที่ซับซ้อนมากขึ้น
เป็นตัวแทนของการทดสอบสมมติฐานในรูปแบบภาพ ( รูปที่ 1 ) ทำให้นักเรียนสร้างการเชื่อมต่อระหว่างความน่าจะเป็นกระจายสถิติอะไรตัวอย่างจะโอกาสให้ประชากรตัวแปร โอกาสของการทดสอบทางสถิติระบุพารามิเตอร์และผลเชิงตัวเลขสำหรับ p
เมื่อจบการศึกษายังคงมีปัญหากับนักเรียนพยายามที่จะเรียนรู้กฎและ misapplying ; นี้ยังถูกตั้งข้อสังเกตโดยบังเอิญ , Delmas และการ์ฟิลด์ ( 2547 )นักศึกษาเหล่านี้ระบุไว้ว่า ถ้าระดับต่ำกว่า 0.05 แล้วสมมติฐานโมฆะจะไม่ปฏิเสธ ความเข้าใจผิดอีกอย่างคือว่า ผลคือความเป็นไปได้ของการไม่ถูกต้อง ( สังเกตได้จาก gliner , ปลิง& , มอร์แกน , 2002 ) นอกจากนี้ยังมีอีกหนึ่งความเข้าใจผิดที่ถูกต้องบางส่วน ที่ P-value ให้ความน่าจะเป็นของการสังเกตนี่คือการตีความง่ายกว่าคำนิยามที่ถูกต้องของ p , และจะปรากฏขึ้นเพื่อให้ความรู้สึกกับนักศึกษา
ถาวรมากที่สุดและความเข้าใจผิดที่ p-value คือความน่าจะเป็นที่สมมติฐานโมฆะจริง ความเข้าใจผิดนี้ยังถูกตรวจสอบ โดย gliner ปลิง และมอร์แกน ( 2002 ) เมื่อผู้สอนตระหนักว่านักเรียนบางคนมีความเข้าใจผิดนี้เธอแจ้งข้อผิดพลาดของพวกเขา หลังนี้กลยุทธ์ อย่างไรก็ตาม ดูเหมือนจะไม่ต่างกัน นี่คือการตีความง่ายกว่าคำนิยามที่ถูกต้องของ p และปรากฏขึ้นเพื่อให้ความรู้สึกให้กับนักเรียนที่มีผลมันไม่ปล่อยไว้ ความเข้าใจผิดนี้แสดงให้เห็นว่านักเรียนสามารถแปลเนื้อหาใหม่ในแง่ของสิ่งที่พวกเขารู้อยู่แล้วถ้ามันไม่ถูกต้อง เพื่อให้แนวคิดเปลี่ยนใช้ความพยายามและนักเรียนจะไม่พยายามนี้จนกว่าพวกเขาจะดูมีเหตุผลที่ดีที่จะทำเช่นนั้น ( พอสเนอร์ ปะทะ Hewson , & gertzog , 1982 ) ดังนั้นอาจารย์ต้องทราบว่าเป็นนักเรียนที่คลาดเคลื่อนอาจจะผลิตและพัฒนากิจกรรมการเรียนการสอน เพื่อหลีกเลี่ยงเหล่านี้เกิดขึ้น .
จากมุมมองของผู้สอน ,การใช้แบบจำลองคอมพิวเตอร์ที่ปรากฏที่จะส่งผลให้นักเรียนมีส่วนร่วมมากขึ้นในการทำงานและสามารถเข้าใจในบางพื้นที่ของสถิติที่ได้รับยากด้วยวิธีการเดิมของการสอนองค์ประกอบของความประหลาดใจในผลของสถานการณ์จำลองที่แนะนำทฤษฎีขีดจำกัดกลาง ส่งผลให้นักเรียนมีมากมีแนวโน้มที่จะจำความมีรูปแบบการกระจายแบบปกติหลังจากการฝึกในการถดถอยเชิงเส้นที่ " ผิด " โดยนักเรียนที่ดูเหมือนจะรับมือได้อย่างสะดวกมากขึ้นมากกับความคิดที่สามารถมีได้ไม่มีความสัมพันธ์ระหว่างตัวแปรได้เมื่อมีไม่เป็นศูนย์ลาด . เพราะนักเรียนมีความคุ้นเคยกับภาพ p-values แทน ,นักเรียนยังมีปัญหาเล็ก ๆน้อย ๆในเงื่อนไขมาด้วยหลักการประเภทและชนิดจะผิด และคิดว่าการกระจายของ " สถานการณ์จริง " อาจจะทับซ้อนกับการเสนอสถานการณ์ คำถามในการสอบที่ให้นักเรียนอธิบายผลของความคลาดเคลื่อนประเภทที่ 1 ได้ในบริบทที่เฉพาะเจาะจงมักจะทำได้ดี
การศึกษานี้ให้พื้นฐานสำหรับพัฒนาการเรียนการสอนเพื่อช่วยในความเข้าใจของนักเรียนต่อค่า มันยังแสดงให้เห็นพื้นที่ที่อาจมีผลวิจัยเพิ่มเติม เช่น ทำไมนักเรียนมา เชื่อว่า ผลคือความเป็นไปได้ของสมมติฐานว่างถูกจริง
การแปล กรุณารอสักครู่..
