Conclusion
This workbook offers several simulation models that are appropriate for use of three common research designs for evaluating program effects. The logic of these simulations can be easily extended to other relevant research contexts. For instance, many agencies routinely conduct sample surveys to identify needs and target populations, assess services that are provided, and compare agency functioning with the performance of other similar agencies or with some standard. One would construct simulation models for survey instruments for the same reasons that they are constructed for evaluation designs--to improve teaching and general understanding, to explore problems in implementing the survey (such as non response patterns), or to examine the probable effect of various analytic strategies. The key to doing this would again rest on the statistical model used to generate hypothetical survey responses. A "true score" measurement model is useful, at least for simple simulations, but may have to be modified. For instance, assume that one question on a survey deals with client satisfaction with a particular service and that the response is a 7-point Likert-type format where 1=very dissatisfied, 7=very satisfied, and 4=neutral. The analyst could make the assumption that for some sample or subsample the true average response is a scale value equal to 5 points (somewhat satisfied), and that the true distribution of responses is normal around these values, with some standard deviation. At some point, the analyst will have to convert this hypothetical underlying continuous true distribution to the 7-point integer response format either by rounding or by generating normally distributed random integers in the first place. Such a variable could then be correlated or cross-tabulated with other generated responses to explore analytic strategies for that survey. Similar extensions of the models discussed here can be made for simulations of routinely collected management information system (MIS) information, for data for correlational studies, or for time-series situations, among others.
Simulations are assumptive in nature and vary in quality to the degree that the reality is correctly modeled. When constructing a simulation, it is important that the analyst seek out empirical evidence to support the assumptions that are made whenever this is feasible. For instance, it should be clear that the simulations described here could be greatly enhanced if we had more specific data on how much and what type of attrition typically occurs, what type of floor or ceiling effects are common, what patterns of misassignment relative to the cutoff value typically arise for the RD design, what the typical test-retest reliabilities (for use in reliability-corrected ANCOVA) might be, and so on. Although some relevant data will be available in the methodological literature, all of these issues are context specific and demand that the analyst know the setting in some detail if the simulations are to be reasonable.
One way to approach the assumptive nature of the simulation task is to recognize that reality conditions or constraints in the models need to be examined systematically across a range of plausible conditions. This implies that multiple analyses under systematically varied conditions that are based upon principles of parametric experimental design are needed in state-of-the art simulation work. This point is made well by Heiberger et al. (1983:585):
The computer has become a source of experimental data for modern statisticians much as the farm field was to the developers of experimental design. However, many "field" experiments have largely ignored fundamental principles of experimental design by failing to identify factors clearly and to control them independently. When some aspects of test problems were varied, others usually changed as well--often in unpredictable ways. Other computer-based experiments have been ad hoc collection of anecdotal results at sample points selected with little or no design.
Heiberger et al. (1983) go on to describe a general model for simulation design that allows the analyst to control systematically a large number of relevant parameters across some multidimensional reality space, including the sample size, number of endogenous variables, number of "key points" or condition values, matrix eigenvalues and eigenvectors, intercorrelations, least squares regression coefficients, means standard errors, and so on.
Although rigorous, experimentally based simulations are essential for definitive analysis of complex problems, they will not always be feasible or even desirable for many program evaluation contexts. Instead, it is important to recognize that simulations are generally a useful tool that can be used to conduct more definitive statistical studies. However, simulations in program evaluation can provide the analyst with the means to explore and probe simple relevant data structures for th
สรุปสมุดงานนี้มีแบบจำลองต่าง ๆ ที่เหมาะสมกับการใช้สามการออกแบบการวิจัยทั่วไปสำหรับการประเมินผลโปรแกรม ตรรกะของแบบจำลองเหล่านี้สามารถขยายได้อย่างง่ายดายเพื่อบริบทการวิจัยอื่น ๆ ที่เกี่ยวข้อง ตัวอย่าง หลายหน่วยงานตรวจพฤติกรรมการสำรวจด้วยตัวอย่าง เพื่อระบุความต้องการและเป้าหมายประเมินบริการที่มีให้ และเปรียบเทียบการทำงานกับหน่วยงาน การปฏิบัติงานของหน่วยงานอื่นที่คล้ายคลึงกัน หรือมีบางมาตรฐาน หนึ่งจะสร้างแบบจำลองเครื่องมือสำรวจด้วยเหตุผลเดียวกันกับที่พวกเขาถูกสร้างขึ้นเพื่อการออกแบบการประเมินผล -- เพื่อปรับปรุงการสอนและความรู้ทั่วไป เพื่อศึกษาปัญหาการใช้แบบสำรวจ ( ไม่เช่นรูปแบบการตอบสนอง ) หรือตรวจสอบผลน่าจะเป็นกลวิธีวิเคราะห์ต่าง ๆ คีย์ทำแบบนี้อีกครั้งจะขึ้นอยู่กับสถิติที่ใช้ในการสร้างการตอบสนองการสำรวจแบบสมมุติ " คะแนน " ที่แท้จริงของโมเดลการวัดเป็นประโยชน์ อย่างน้อยก็ใช้ง่าย แต่อาจจะต้องมีการแก้ไข ตัวอย่างเช่น สมมติว่า คำถามในการสำรวจที่เกี่ยวข้องกับความพึงพอใจของลูกค้า ด้วยบริการเฉพาะและการตอบสนองเป็น 7-point คนประเภทรูปแบบที่ 1 = ไม่พอใจมาก , 7 = 4 = พอใจมาก และเป็นกลาง นักวิเคราะห์สามารถทำให้สมมติฐานที่ว่าบางตัวอย่างหรือ subsample ตอบสนองเฉลี่ยจริงเป็นมาตราส่วนมูลค่าเท่ากับ 5 คะแนน ( พอใจมาก ) , และที่จำหน่ายจริงของการตอบสนองเป็นปกติประมาณค่าเหล่านี้ มีบาง ส่วนเบี่ยงเบนมาตรฐาน ในบางจุดที่นักวิเคราะห์จะต้องแปลงนี้สมมุติพื้นฐานอย่างต่อเนื่องจริง การกระจายการ 7-point เต็มรูปแบบทั้งการตอบสนองโดยปัดเศษหรือโดยการสร้างแบบปกติจำนวนเต็มแบบสุ่มในสถานที่แรก ตัวแปรดังกล่าวแล้วอาจจะมีความสัมพันธ์หรือข้ามแยกกับอื่น ๆ ที่สร้างการตอบสนองเพื่อสำรวจกลยุทธ์เชิงวิเคราะห์เพื่อสำรวจว่า . คล้ายกับนามสกุลของรุ่นที่กล่าวถึงที่นี่ได้จำลองของตรวจรวบรวมระบบสารสนเทศเพื่อการจัดการข้อมูล , ข้อมูลนิ หรือ สำหรับอนุกรมเวลา สถานการณ์ ของผู้อื่นจำลองเป็น assumptive ในธรรมชาติ และความแตกต่างในคุณภาพในระดับที่เป็นจริงถูกต้องจำลอง . เมื่อสร้างแบบจำลอง มันสำคัญที่นักวิเคราะห์หาหลักฐานเชิงประจักษ์สนับสนุนสมมติฐานที่ทำเมื่อใดก็ตามที่เป็นไปได้ ตัวอย่าง มันควรจะชัดเจนว่าจำลองอธิบายไว้ที่นี่อาจจะเพิ่มมาก ถ้าเรามีข้อมูลที่เฉพาะเจาะจงมากขึ้นเท่าใดและสิ่งที่ประเภทของการขัดสีมักจะเกิดขึ้น , สิ่งที่ชนิดของพื้นหรือเพดานผลทั่วไป สิ่งที่รูปแบบของ misassignment เทียบกับมูลค่านี้มักจะเกิดขึ้นสำหรับ RD ออกแบบอะไรแบบโดยทั่วไป ( สำหรับใช้ในความน่าเชื่อถือแก้ไข ANCOVA ) อาจจะ , และดังนั้นบน แม้ว่าข้อมูลบางส่วนจะสามารถใช้ได้ในวรรณคดี วิธีการทั้งหมดของปัญหาเหล่านี้เป็นบริบทที่เฉพาะเจาะจงและความต้องการที่ นักวิเคราะห์ รู้จักการตั้งค่าในรายละเอียดบางอย่าง ถ้าใช้จะต้องเหมาะสมวิธีหนึ่งในการเข้าหาธรรมชาติ assumptive ของงานจำลองคือการรับรู้ว่าสภาพความเป็นจริงหรือข้อจำกัดในรุ่นต้องการที่จะตรวจสอบอย่างเป็นระบบในช่วงของเงื่อนไขที่เป็นไปได้ อย่างไรก็ตาม ภายใต้เงื่อนไขที่แตกต่างกันหลายวิเคราะห์อย่างเป็นระบบที่อยู่บนพื้นฐานของหลักการการออกแบบการทดลองเชิงเป็นรัฐของศิลปะในการทำงาน จุดนี้เป็นอย่างดี โดย heiberger et al . ( 1983:585 )คอมพิวเตอร์ได้กลายเป็น แหล่งที่มาของข้อมูลสำหรับสถิติที่ทันสมัยมากเป็นท้องทุ่งนาเป็นนักพัฒนาของการออกแบบการทดลอง อย่างไรก็ตาม มี " สนาม " การทดลองส่วนใหญ่ไม่สนใจหลักการพื้นฐานของการออกแบบการทดลอง โดยมิได้ระบุปัจจัยที่ชัดเจน และคุมมันได้อย่างอิสระ เมื่อบางแง่มุมของปัญหาการทดสอบแตกต่างกันไป คนอื่นมักจะเปลี่ยนไปเช่นกัน . . . มักจะได้วิธี การทดลองด้วยคอมพิวเตอร์อื่น ๆที่ได้รับการเก็บรวบรวมผลเฉพาะกิจ anecdotal ที่ตัวอย่างจุดเลือกออกแบบน้อยหรือไม่มีเลยheiberger et al . ( 1983 ) ไปในการอธิบายรูปแบบทั่วไปสำหรับการจำลองการออกแบบที่ช่วยให้นักวิเคราะห์ในการควบคุมอย่างเป็นระบบเป็นจำนวนมากของพารามิเตอร์ที่เกี่ยวข้องในบางมิติ ความเป็นจริงพื้นที่รวมทั้งขนาดตัวอย่าง จำนวนของตัวแปรภายนอกจำนวน " จุดที่สำคัญ หรือ เงื่อนไข ค่า ค่าเมทริกซ์และเสนอ intercorrelations สัมประสิทธิ์ถดถอยกำลังสองน้อยที่สุด , , , หมายถึงข้อผิดพลาดมาตรฐานและแม้ว่าเคร่งครัด โดยจำลองแบบจากที่จำเป็นสำหรับการวิเคราะห์ที่ชัดเจนของปัญหาที่ซับซ้อน พวกเขาจะไม่เสมอเป็นไปได้ หรือพึงปรารถนาแม้แต่หลายโปรแกรมการประเมินบริบท . แทน , มันเป็นสิ่งสำคัญที่ต้องจำว่าจำลอง โดยทั่วไปจะเป็นเครื่องมือที่มีประโยชน์ที่สามารถใช้ศึกษาทางสถิติมากกว่า อย่างไรก็ตาม แบบจำลองในการประเมินโปรแกรมสามารถให้นักวิเคราะห์ ด้วยวิธีการสำรวจและตรวจสอบข้อมูลโครงสร้างส่วนง่าย
การแปล กรุณารอสักครู่..
