parameter, while the a values were generated from the uniform (0,1) distribution.
For each simulated dataset, a unique set of θ, a and b parameters were generated
for each simulated individual and item; i.e., for each simulation there is a unique
set of item parameters for all k items and j individuals: a (a1, a2, . . . , ak)) and
b, (b1, b2, . . . , bk) and θ, (θ1, θ2, . . . , θk). The resulting probability of having the
attribute was then compared to a randomly generated value from the uniform
(0,1) distribution, with the resulting dichotomous variable being assigned a 1 if
the probability from the 2PL model was larger than the uniform variate, and
a 0 otherwise. Two groups, or clusters, of subjects were simulated with the
difference between them being the mean value of the latent trait; i.e., one group
was associated with a high value while the other was associated with a low value.
There were two sets of these latent variables corresponding to cases of high group
separation and low group separation, with high group separation having means
of either −2 or 2 and low group separation having means of either −0.5 or 0.5.
Other conditions which were varied were the variance of the latent trait (1.5 and
0.5), the number of variables (10 and 24) and the number of subjects (240 and
1000). It should be noted that the two clusters always had an equal number
of subjects, and all combinations of simulation condition were crossed with one
another.
Cluster analysis was conducted using the four distance measures described
above, in addition to the raw dichotomous data with no distance measure applied.
Ward’s method of cluster extraction was selected for use in this study based upon
results indicating that of the major clustering methods, it often performs the best
at population recovery of clusters (Kuiper and Fisher, 1975; Blashfield, 1976;
Overall, Gibson and Novy, 1993). In addition, Hands and Everitt (1987) found
that it performed the best at cluster extraction when used in conjunction with
distance measures of this type. For each simulation, the distance measures were
calculated and the resulting matrices were submitted to the Ward’s method using
the SAS software system. In the case of the raw data, Ward’s method of cluster
extraction was applied directly to the dichotomous variables themselves, with no
distance measures calculated. The results of the cluster analyses were compared
using the percent of cases correctly grouped together, and the Kappa coefficient
of agreement, which takes the form:
พารามิเตอร์ ในขณะค่าสร้างขึ้นจากการแจกแจงเหมือนกัน (0, 1)สำหรับแต่ละชุดข้อมูลจำลอง ค่าθ ชุดไม่ซ้ำแบบ และสร้างพารามิเตอร์ bสำหรับแต่ละบุคคลเลียนแบบและสินค้า เช่น สำหรับการจำลองแต่ละมีไม่ซ้ำกันชุดของพารามิเตอร์สินค้าสำหรับสินค้า k และ j บุคคล: มี (a1, a2,..., ak)) และb, (b1, b2,..., bk) และค่าθ, (θ1, θ2,..., θk) ความน่าเป็นผลของการมีการแอตทริบิวต์ถูกเปรียบเทียบเป็นค่าสุ่มจากเครื่องแบบการแจกจ่าย (0,1) กับตัวแปรผลนานที่ถูกกำหนดถ้า 1ความน่าเป็นจากแบบจำลอง 2PL มีขนาดใหญ่กว่า variate สม่ำเสมอ และ0 อย่างอื่น 2 กลุ่ม หรือ กลุ่มของวัตถุที่ถูกจำลองด้วยการความแตกต่างระหว่างค่าเฉลี่ยของลักษณะแฝง อยู่ กลุ่มหนึ่งเช่นถูกเชื่อมโยงกับค่าสูงในขณะที่อื่น ๆ ที่เกี่ยวข้อง มีค่าต่ำมีสองชุดของตัวแปรแฝงเหล่านี้สอดคล้องกับกรณีของกลุ่มสูงการแยกและการแยกกลุ่มต่ำ มีการแยกกลุ่มสูงมีหมายความว่า−2 หรือแยกต่ำ และ 2 กลุ่มที่มีหมายความว่า −0.5 หรือ 0.5เงื่อนไขอื่น ๆ ที่ได้มีความแปรปรวนของลักษณะแฝง (1.5 และ0.5), หมายเลขของตัวแปร (10 และ 24) และจำนวนของวัตถุ (240 และ1000) . มันควรจะสังเกตว่า คลัสเตอร์สองมักจะมีหมายเลขเท่าวัตถุ และชุดทั้งหมดของการจำลองสภาพถูกข้ามด้วยอื่นการวิเคราะห์คลัสเตอร์ดำเนินการโดยใช้มาตรการระยะที่สี่ที่อธิบายไว้ข้างบน นอกเหนือจากข้อมูลดิบนานด้วยไม่มีการวัดระยะทางใช้เลือกของผู้ป่วยวิธีสกัดคลัสเตอร์สำหรับใช้ในการศึกษานี้ตามผลลัพธ์บ่งชี้ว่า ใหญ่ clustering วิธี มันมักจะทำดีสุดที่กู้ประชากรของคลัสเตอร์ (Kuiper และฟิชเชอร์ 1975 Blashfield, 1976โดยรวม กิบสันและท่า 1993) นอกจากนี้ มือและ Everitt (1987) พบดำเนินการที่ดีสุดที่สกัดคลัสเตอร์เมื่อใช้ร่วมกับวัดระยะทางชนิดนี้ สำหรับแต่ละการจำลอง วัดระยะทางได้คำนวณ และเมทริกซ์ผลส่งมาที่วิธีการของผู้ป่วยโดยใช้ซอฟต์แวร์ระบบ SAS ในกรณีที่ข้อมูลดิบ วิธีการของผู้ป่วยของคลัสเตอร์สกัดตัวนานแปรตัวเอง ไม่ใช้โดยตรงมาตรการระยะที่คำนวณ เปรียบเทียบผลลัพธ์ของการวิเคราะห์คลัสเตอร์ใช้เปอร์เซ็นต์ของกรณีที่จัดอย่างถูกต้อง และค่าสัมประสิทธิ์ Kappaข้อตกลง ซึ่งใช้รูปแบบ:
การแปล กรุณารอสักครู่..
. พารามิเตอร์ในขณะที่ค่าที่ถูกสร้างขึ้นจากเครื่องแบบ (0,1) การกระจาย
สำหรับแต่ละชุดจำลองชุดที่ไม่ซ้ำของθ, A และ B พารามิเตอร์ถูกสร้างขึ้น
สำหรับแต่ละบุคคลจำลองและรายการ; คือสำหรับการจำลองแต่ละมีที่ไม่ซ้ำกัน
ชุดของพารามิเตอร์รายการสำหรับรายการ K ทั้งหมดและบุคคล J: A (... A1, A2, AK)) และ
... B (B1, B2, BK) และθ (θ1, θ2,..., θk) น่าจะเกิดจากการมี
แอตทริบิวต์แล้วเมื่อเทียบกับค่าที่สร้างแบบสุ่มจากเครื่องแบบ
(0,1) การกระจายกับตัวแปร dichotomous ส่งผลให้ได้รับมอบหมาย 1 ถ้า
เป็นไปได้จากแบบจำลอง 2PL เป็นขนาดใหญ่กว่าตัวแปรเหมือนกันและ
0 มิฉะนั้น สองกลุ่มหรือกลุ่มของอาสาสมัครที่ถูกจำลองที่มี
ความแตกต่างระหว่างพวกเขาเป็นค่าเฉลี่ยของลักษณะแฝง; คือกลุ่มหนึ่งที่
มีความสัมพันธ์กับค่าสูงในขณะที่คนอื่น ๆ ที่เกี่ยวข้องกับค่าต่ำ.
มีสองชุดของตัวแปรแฝงเหล่านี้สอดคล้องกับกรณีของกลุ่มสูง
แยกและการแยกกลุ่มต่ำที่มีการแยกกลุ่มสูงมีวิธีการ
อย่างใดอย่างหนึ่ง -2 หรือ 2 และต่ำแยกกลุ่มมีวิธีการอย่างใดอย่างหนึ่งหรือ -0.5 0.5.
เงื่อนไขอื่น ๆ ซึ่งแตกต่างกันมีความแปรปรวนของลักษณะแฝง (1.5 และ
0.5) จำนวนของตัวแปร (10 และ 24) และจำนวนของอาสาสมัคร (240
1000) มันควรจะตั้งข้อสังเกตว่าทั้งสองกลุ่มมักจะมีจำนวนเท่ากัน
ของอาสาสมัครและการรวมกันทั้งหมดของสภาพจำลองถูกข้ามกับคน
อื่น.
การวิเคราะห์กลุ่มได้ดำเนินการโดยใช้มาตรการระยะทางสี่อธิบายไว้
ข้างต้นนอกเหนือไปจากข้อมูล dichotomous ดิบกับระยะทางไม่มี วัดนำไปใช้.
วิธีการของวอร์ดของการสกัดคลัสเตอร์ได้รับเลือกเพื่อใช้ในการศึกษาครั้งนี้ขึ้นอยู่กับ
ผลการแสดงให้เห็นว่าวิธีการจัดกลุ่มใหญ่ก็มักจะทำงานได้ดีที่สุด
ในการกู้คืนประชากรกลุ่ม (ไคเปอร์และฟิชเชอร์, 1975; Blashfield 1976;
โดยรวม, กิบสัน และ Novy, 1993) นอกจากนี้มือและ Everitt (1987) พบ
ว่าการดำเนินการที่ดีที่สุดในการสกัดคลัสเตอร์เมื่อใช้ร่วมกับ
มาตรการระยะทางประเภทนี้ สำหรับการจำลองแต่ละมาตรการระยะทางที่ได้รับ
การคำนวณและการฝึกอบรมที่เกิดขึ้นถูกส่งไปวิธีการที่วอร์ดโดยใช้
ระบบซอฟต์แวร์ SAS ในกรณีของข้อมูลดิบวิธีวอร์ดของคลัสเตอร์
สกัดถูกนำมาใช้โดยตรงกับตัวแปร dichotomous ตัวเองโดยไม่มี
มาตรการระยะทางคำนวณ ผลที่ได้จากการวิเคราะห์กลุ่มมาเปรียบเทียบ
โดยใช้เปอร์เซ็นต์ของกรณีกลุ่มเข้าด้วยกันได้อย่างถูกต้องและค่าสัมประสิทธิ์แคปป้า
ของข้อตกลงซึ่งจะมีรูปแบบ:
การแปล กรุณารอสักครู่..
พารามิเตอร์ ในขณะที่คุณค่าถูกสร้างขึ้นจากชุด ( 0.1 ) กระจายแต่ละชุดข้อมูลจำลอง ชุดเฉพาะของθ , A และ B ได้ทำการสร้างขึ้นสำหรับแต่ละบุคคล และรายการนี้ คือ แต่ละแบบมีเอกลักษณ์ตั้งค่าพารามิเตอร์สำหรับรายการทั้งหมดของ K และ J บุคคล : ( A1 , A2 , . . . . . . . . , AK ) และB ( B1 , B2 , . . . . . . . . , BK ) และθθθ ( 1 , 2 , . . . . . . . . θ , K ) ผลของการมีความน่าจะเป็นแล้วเมื่อเทียบกับคุณลักษณะถูกสร้างขึ้นแบบสุ่มค่าจากชุด( 0.1 ) กระจาย กับผลตัวแปรที่ได้รับมอบหมาย 1 ถ้าไดโคโตมัสความน่าจะเป็นจาก 2pl รูปแบบมีขนาดใหญ่กว่า variate เครื่องแบบและ0 เป็นอย่างอื่น สองกลุ่ม หรือกลุ่มของกลุ่มตัวอย่าง ) กับความแตกต่างระหว่างพวกเขาเป็นค่าเฉลี่ยของลักษณะแฝง คือ หนึ่งกลุ่มมีความสัมพันธ์กับค่าสูงในขณะที่อื่น ๆที่เกี่ยวข้องกับมูลค่าต่ำมีสองชุดของตัวแปรแฝงเหล่านี้สอดคล้องกับกรณีของกลุ่มสูงการแยกและการแยกกลุ่มน้อย กลุ่มสูงมีวิธีการแยกของ− 2 หรือ 2 และกลุ่มต่ำแยกมีวิธีการอย่างใดอย่างหนึ่งหรือ− 0.5 0.5เงื่อนไขอื่น ๆ ที่แตกต่างกันมีความแปรปรวนของลักษณะแฝง ( 1.5 และ2 ) จำนวนของตัวแปร ( 10 และ 24 ) และจำนวนประชากร 240 และ1000 ) มันควรจะสังเกตว่าทั้งสองกลุ่มมีจำนวนเท่ากันเสมอวิชา และชุดทั้งหมดของการจำลองสภาพถูกข้ามกับอีกการวิเคราะห์กลุ่มจำนวน 4 มาตรวัดระยะห่างที่อธิบายข้างต้น นอกจากวัตถุดิบ dichotomous ข้อมูลไม่มีวัดระยะห่างที่ใช้วิธีผู้ป่วยของการสกัดกลุ่มถูกเลือกเพื่อใช้ในการศึกษานี้ขึ้นอยู่กับผลลัพธ์ที่แสดงให้เห็นว่าของสำคัญสำหรับวิธีการ มันมักจะมีประสิทธิภาพดีที่สุดที่กู้คืนและประชากรของกลุ่ม ( คุยเปอร์ฟิชเชอร์ , 1975 ; blashfield , 1976 ;โดยรวม , กิ๊บสัน และ โนวี่ , 1993 ) นอกจากนี้ มือ และ everitt ( 1987 ) พบว่าที่แสดงดีที่สุดในการสกัดกลุ่มเมื่อใช้ควบคู่กับการวัดระยะทางของประเภทนี้ สำหรับแต่ละจำลองระยะทางมาตรการคือคำนวณและผลของเมทริกซ์ที่ถูกส่งไปยังแผนกโดยใช้วิธีของเช่นซอฟต์แวร์ระบบ ในกรณีของข้อมูล วิธีการวอร์ดของคลัสเตอร์การสกัดที่ใช้โดยตรงกับไดโคโตมัสแปรตัวเอง ไม่มาตรวัดระยะห่างที่คำนวณไว้ ผลของการวิเคราะห์เปรียบเทียบกลุ่มใช้เปอร์เซ็นต์ของกรณีถูกจัดกลุ่มเข้าด้วยกัน และค่าสัมประสิทธิ์แคปปาของข้อตกลงซึ่งใช้รูปแบบ :
การแปล กรุณารอสักครู่..