International Statistical Review (2009), 77, 3, 378–394 doi:10.1111/j.1751-5823.2009.00092.x
The Intra-Cluster Correlation Coefficient
in Cluster Randomized Trials: A Review
of Definitions
Sandra M. Eldridge1, Obioha C. Ukoumunne2
and John B. Carlin2
1Barts and London School of Medicine and Dentistry, Queen Mary University of London, UK
2Murdoch Children’s Research Institute and Department of Paediatrics, University of Melbourne,
Australia
E-mail: s.eldridge@qmul.ac.uk
Summary
The intra-cluster correlation coefficient (ICC) of the primary outcome plays a key role in the
design and analysis of cluster randomized trials (CRTs), but the precise definition of this parameter
is somewhat elusive, especially in the context of non-normally distributed outcomes. In this paper,
we provide a unified treatment of ICC as used in CRTs. We present a general definition of the ICC
that may be expressed in different ways depending on the modelling approach used to describe the
data, illustrating how this general definition is applied to continuous and dichotomous outcomes.
Greater complexity arises for dichotomous outcomes; in particular, the usual definition of the ICC
cannot be related directly to the parameters of the logistic-normal model that is commonly used
for dichotomous outcomes. We show how the definition of the ICC is different when covariates are
introduced. Finally, we use our framework and definition of the ICC to draw out implications for
those interpreting and choosing values of the ICC when planning CRTs.
Key words: Intra-cluster correlation coefficient; cluster randomized trials.
1 Introduction
The intra-cluster correlation coefficient (ICC) of the primary outcome plays a key role in the
design and analysis of cluster randomized trials (CRTs), in which clusters such as health care
organizations, school classes, or geographic areas are randomized to trial arms, and outcomes
are measured on individuals within those clusters. The ICC, usually denoted ρ, quantifies the
degree of similarity in the responses of individuals from the same cluster for the outcome. In
the design of CRTs, an estimate of ρ is commonly used to calculate the variance inflation factor
(Donner & Klar, 2000), also known as the design effect (Kish, 1965), which is then used to
adjust the sample size that would be required for a trial in which individuals are randomized
rather than clusters.
In recent years there has been a proliferation of papers reporting estimates of ρ for various
outcomes and different types of cluster in order to facilitate the design of future trials. In these
papers, ICCs are usually calculated directly from completed trials (Cosby et al., 2003; Elley
C 2009 The Authors. Journal compilation C
2009 International Statistical Institute. Published by Blackwell Publishing Ltd, 9600 Garsington Road,
Oxford OX4 2DQ, UK and 350 Main Street, Malden, MA 02148, USA.
Definition of the Intra-Cluster Correlation Coefficient 379
et al., 2005; Parker et al., 2005), but sometimes from surveys or audit data (Adams et al., 2004;
Campbell et al., 2005) and sometimes taking covariates into account (Adams et al., 2004).
Different methods can be used to estimate ICCs (Donner, 1986; Ridout et al., 1999), ranging
from simple one-way analysis of variance (Searle, 1971) for survey, audit, pre-intervention,
and control-group-only data to regression-based methods when post-intervention data from all
trial arms are used and/or investigators want to adjust for covariates. Regression-based methods
commonly used to analyse data from CRTs include fitting marginal models using generalized
estimating equations (GEEs) (Liang & Zeger, 1986) and mixed effects models using maximumlikelihood
estimation (Goldstein, 1995). Mixed effects models are usually used to calculate
ICCs when such calculation is the primary aim of the analysis (Adams et al., 2004; Elley et al.,
2005), since the ICC arises naturally from these models. However, following the analysis of a
CRT using a marginal model such as under the GEE method, ICCs may also be estimated as a
by-product of the analysis. The assumptions underpinning mixed effects models and analysis of
variance methods do not allow true ICCs to be negative although the marginal model does. It
is generally believed that in the context of cluster sampling and CRTs, true ICCs are unlikely
to be negative (Ferrinho et al., 1992; Donner & Klar, 1994). For dichotomous outcomes there
is empirical evidence for a relationship between ρ and the overall prevalence (Gulliford et al.,
2005), and the definition of ρ may depend on the type of model adopted to analyse the data
(Evans et al., 2001). Thus, an estimated ICC can be obtained in various ways from data with
different structures, and may depend on the setting and the model adopted. There has been little
discussion of the appropriateness of different ICC estimates in planning CRTs.
In addition to their use in CRTs, there are bodies of literature that discuss aspects of the ICC
in the context of quantifying the reliability of instruments (including inter-rater and intra-rater
agreement (Bodian, 1994; Streiner & Norman, 2003), and within-class homogeneity for genetic
traits (Harris, 1913; Molenberghs et al., 1996; Sham, 1998)). In both fields the measure is
known as the intra-class correlation coefficient, an older and more general term than intracluster
correlation coefficient. There is no consensus over its origins (Werner, 1977; Karlin
et al., 1981; Schemper, 1986; Muller & Buttner, 1994; Streiner & Norman, 2003). The earliest
reference we could find presents the ICC as a purely descriptive measure of the resemblance
of the characteristics of any pair of individuals from the same class “as compared with random
pairs from the population (or universe) which they constitute” (Harris, 1913), with no modelling
or distributional assumptions underlying its calculation. In common with the evolution of many
statistical concepts, a model-based approach, in which probability models are specified for the
underlying variables in terms of the parameters of interest, is nowmore usual. In the extensive and
growing literature on the ICC, a large number of papers focus on its estimation. Donner (1986)
provides an overview of estimators for continuous outcomes and Ridout et al. (1999) for binary
outcomes. Few papers, however, focus specifically on the definition of the ICC (Schemper,
1986; Commenges & Jacquin, 1994) or treat continuous and binary outcomes together, and no
papers focus on its definition with specific application to CRTs.
In this paper we present a unified discussion of the definition of the ICC focusing on CRTs. In
Section 2 we present a framework for our discussion, introducing assumptions about the nature
of the correlation between subjects within clusters, which correspond to a general definition of
ρ that may be expressed in different ways depending on the modelling approach used to define
the data structure. We illustrate how this general definition is applied to continuous (Section 3)
and dichotomous (Section 4) outcomes, showing that it is more complicated in the latter context.
In Section 5 we show how the definition of ρ is different when covariates are introduced. This
is particularly relevant for our focus on CRTs where effectively there is always at least one
covariate: trial arm status. In Section 6 we use our framework and definition of ρ to draw out
implications for those interpreting and choosing values of ρ when planning CRTs.
International Statistical Review (2009), 77, 3, 378–394
C
2009 The Authors. Journal compilation C 2009 International Statistical Institute
380 S.M. ELDRIDGE, O.C. UKOUMUNNE & J.B. CARLIN
2 A General Definition of the ICC
In developing the framework for this paper we restrict our discussion to trials with just one
level of clustering, for example patients (cluster members) within general practices (clusters) or
pupils (cluster members) within schools (clusters). We do not consider situations with nested
levels of clustering, such as patient consultations (cluster members, level 1) within patients
(clusters, level 2) within general practices (clusters, level 3). Nested levels of clustering may
arise in complex surveys (Gulliford et al., 1999), community- or school-based trials (Siddiqui
et al., 1996), or trials randomizing general practices (Griffiths et al., 2004), but studies with one
level of clustering are more common.
The fundamental definition of the ICC is derived from the expression for the correlation
between responses from two individuals. Two basic assumptions underlie the definition: (i) any
two responses from different clusters are independent, but pairs of responses within clusters are
correlated, and (ii) the correlation is the same for all pairs of individuals from the same cluster.
The correlation between the j-th and l-th responses in the i-th cluster can then be written as:
ρi = cov(Yij, Yil)/
var(Yij) var(Yil) ∀ j = l. (1)
However, unless we wish to model dependence of the correlation on cluster characteristics,
there is no reason to assume that the strength of correlation will vary among clusters in aCRT, and
we, therefore, assume that there is a single common ρ applying to all clusters. This corresponds
to what has variously been described in different contexts as the common correlation, compound
symmetry, or exchangeability assumption (Liang & Zeger, 1986). The common correlation
assumption implies that the dependence on i in equation (1) can be suppressed, so we have a
general definition of the ICC as:
ρ = cov(Yij, Yil)/
var(Yij) var(Yil) ∀ j = l and ∀ i . (2)
All expressions of ρ presented in this paper are based on equation (2).
The algebraic forms for different expressions of the ICC depend on the type of outcome and
model used to describe the data structure. The two main modelling approaches for data from
CRTs are (i) to directly model the covariance structure in the data and (ii) to u
นานาชาติสถิติตรวจทาน (2009), 77, 3, 378-394 doi:10.1111/j.1751-5823.2009.00092.xสัมประสิทธิ์สหสัมพันธ์ภายในคลัสเตอร์ในคลัสเตอร์ Randomized ทดลอง: ตรวจทานของข้อกำหนดSandra เมตร Eldridge1, Obioha C. Ukoumunne2และจอห์นบี Carlin21Barts และลอนดอนโรงเรียนแพทย์และทันตกรรม ควีนแมรีมหาวิทยาลัยลอนดอน สหราชอาณาจักรสถาบันวิจัยและแผนก Paediatrics มหาวิทยาลัยเมลเบิร์น เด็ก 2Murdochออสเตรเลียอีเมล์: s.eldridge@qmul.ac.ukสรุปสัมประสิทธิ์สหสัมพันธ์ภายในคลัสเตอร์ (ICC) ผลการหลักมีบทบาทสำคัญในการออกแบบและการวิเคราะห์ของคลัสเตอร์ randomized ทดลอง (CRTs), แต่คำนิยามที่ชัดเจนของพารามิเตอร์นี้คือค่อนข้างเข้าใจยาก โดยเฉพาะอย่างยิ่งในบริบทของการกระจายไม่ใช่ปกติผล ในเอกสารนี้เราให้การรักษารวมของ ICC ใช้ใน CRTs เรานำเสนอคำนิยามทั่วไปของ ICCที่อาจแสดงได้หลายวิธีการสร้างแบบจำลองที่ใช้อธิบายการข้อมูล แสดงวิธีใช้ข้อกำหนดนี้ทั่วไปกับผลอย่างต่อเนื่อง และ dichotomousความซับซ้อนมากขึ้นเกิดผล dichotomous โดยเฉพาะอย่างยิ่ง ความละเอียดปกติของ ICCไม่เกี่ยวข้องโดยตรงกับพารามิเตอร์ของแบบจำลอง logistic ปกติที่ใช้ทั่วไปผล dichotomous แสดงคำนิยามของ ICC ว่าแตกต่างกันเมื่อ covariatesแนะนำ สุดท้าย เราใช้กรอบและคำจำกัดความของ ICC ของเราถอนผลสำหรับผู้ตีความ และเลือกค่าของ ICC เมื่อวาง CRTsคำสำคัญ: สัมประสิทธิ์สหสัมพันธ์ภายในคลัสเตอร์ คลัสเตอร์ randomized ทดลองบทนำ 1สัมประสิทธิ์สหสัมพันธ์ภายในคลัสเตอร์ (ICC) ผลการหลักมีบทบาทสำคัญในการออกแบบและการวิเคราะห์ของคลัสเตอร์ randomized ทดลอง (CRTs), ในคลัสเตอร์ใดเช่นสุขภาพองค์กร โรงเรียนสอน หรือพื้นที่ทางภูมิศาสตร์เป็น randomized ทดลองอาวุธ และผลลัพธ์มีวัดในบุคคลภายในคลัสเตอร์นั้น ICC ρ มักจะสามารถบุ quantifiesระดับของความคล้ายคลึงกันในการตอบสนองของบุคคลจากคลัสเตอร์เดียวกันสำหรับผล ในออกแบบ CRTs ประมาณการของρเป็นที่นิยมใช้ในการคำนวณอัตราเงินเฟ้อต่าง(Donner & ร่องกล้า 2000), เรียกอีกอย่างว่าออกผล (Kish, 1965), ซึ่งถูกใช้เพื่อปรับขนาดของตัวอย่างที่จะจำเป็นสำหรับการทดลองที่เป็น randomized บุคคลที่แทนคลัสเตอร์ในปีที่ผ่านมา ได้มีการแพร่หลายของเอกสารรายงานการประเมินของρต่าง ๆผลที่ได้และชนิดต่าง ๆ ของคลัสเตอร์เพื่อช่วยในการออกแบบการทดลองในอนาคต ในเหล่านี้เอกสาร ICCs มักคำนวณโดยตรงจากการทดลองเสร็จสมบูรณ์ (คอสบีและ al., 2003 ElleyC 2009 ผู้เขียน รวบรวมสมุดรายวัน C2009 ประเทศสถิติสถาบัน เผยแพร่ โดย Blackwell ประกาศ จำกัด 9600 Garsington Roadอ๊อกซฟอร์ด OX4 2DQ, 350 Main Street, Malden, MA 02148 สหรัฐอเมริกาและสหราชอาณาจักรคำนิยามของสัมประสิทธิ์สหสัมพันธ์ของคลัสเตอร์ Intra 379ร้อยเอ็ด al., 2005 ปาร์คเกอร์ et al., 2005), แต่บางครั้ง จากการสำรวจหรือตรวจสอบข้อมูล (Adams et al., 2004Campbell et al., 2005) และบางครั้งการ covariates เข้าบัญชี (Adams et al., 2004)สามารถใช้วิธีการประเมิน ICCs (Donner, 1986 ตั้งแต่ Ridout et al., 1999),จากง่ายทางเดียววิเคราะห์ความแปรปรวน (Searle, 1971) สำรวจ ตรวจสอบ แทรก แซงก่อนควบคุมกลุ่มข้อมูลเดียวกับวิธีการถดถอยเมื่อแทรกแซงหลังและข้อมูลจากแผ่นดินที่ทดลองใช้ หรือต้องปรับ covariates สืบสวน วิธีการถดถอยโดยทั่วไปใช้ในการวิเคราะห์ข้อมูลจาก CRTs รวมรูปแบบกำไรที่เหมาะสมโดยใช้การตั้งค่าทั่วไปการประมาณการสมการ (GEEs) (เหลียง & Zeger, 1986) และผสมแบบจำลองลักษณะพิเศษที่ใช้ maximumlikelihoodประเมิน (Goldstein, 1995) รูปแบบลักษณะพิเศษผสมมักจะใช้ในการคำนวณICCs เมื่อคำนวณดังกล่าวเป็นเป้าหมายหลักของการวิเคราะห์ (Adams et al., 2004 Elley et al.,2005), เนื่องจาก ICC เกิดขึ้นตามธรรมชาติจากโมเดลเหล่านี้ อย่างไรก็ตาม วิธีการวิเคราะห์การจอภาพ CRT ที่ใช้แบบร่อแร่เช่นภายใต้วิธี GEE, ICCs อาจถูกประเมินเป็นการผลพลอยได้ของการวิเคราะห์ สมมติฐาน underpinning รุ่นผสมผลและวิเคราะห์วิธีผลต่างให้ ICCs จริงจะลบแม้ว่ารูปแบบกำไรไม่ มันโดยทั่วไปเชื่อกันว่าในบริบทของการสุ่มตัวอย่างคลัสเตอร์ และ CRTs, ICCs จริงไม่น่าเป็นค่าลบ (Ferrinho et al., 1992 Donner & ร่องกล้า 1994) Dichotomous ผลมีประจักษ์หลักฐานความสัมพันธ์ระหว่างความชุกโดยรวมและρ (Gulliford et al.,2005), และนิยามของρอาจขึ้นอยู่กับชนิดของแบบจำลองที่นำมาใช้เพื่อวิเคราะห์ข้อมูล(อีวานส์และ al., 2001) จึง ICC ที่ประเมินได้จากข้อมูลมีหลายวิธีโครงสร้างแตกต่างกัน และอาจขึ้นอยู่กับการตั้งค่าและรูปแบบนำมาใช้ มีน้อยสนทนาความของ ICC ต่าง ๆ ประเมินวางแผน CRTsนอกจากใช้ใน CRTs มีเนื้อหาของวรรณกรรมที่อธิบายลักษณะของ ICCในบริบทของความน่าเชื่อถือของเครื่องมือ (รวมระหว่าง rater และอินทรา rater quantifyingข้อตกลง (Bodian, 1994 Streiner และนอร์แมน 2003), และ homogeneity สำหรับในระดับพันธุกรรมลักษณะ (แฮร์ริส ค.ศ. 1913 Molenberghs et al., 1996 ซัมซุยโป 1998)) ในทั้งสองฟิลด์ หน่วยวัดเป็นหรือที่เรียกว่าสัมประสิทธิ์สหสัมพันธ์ภายในคลาส เป็นเงื่อนไขทั่วไป และรุ่นเก่ากว่า intraclusterสัมประสิทธิ์สหสัมพันธ์ มีมติไม่ผ่านกำเนิด (Werner, 1977 Karlinร้อยเอ็ด al., 1981 Schemper, 1986 มูลเลอร์และ Buttner, 1994 Streiner และนอร์แมน 2003) แรกสุดเราสามารถหาอ้างอิงแสดง ICC เป็นการวัดความคล้ายคลึงการอธิบายเพียงอย่างเดียวลักษณะของบุคคลจากระดับเดียวกัน "ตกสุ่มคู่ใด ๆคู่จากประชากร (หรือจักรวาล) ซึ่งพวกเขาเป็น" (แฮร์ริส ค.ศ. 1913), ด้วยไม่มีการสร้างแบบจำลองหรือสมมติฐานขึ้นที่ต้นแบบการคำนวณ In common with วิวัฒนาการของแนวคิดทางสถิติ ใช้รูปแบบวิธีการ ในความน่าเป็นการระบุรูปแบบสำหรับการต้นแบบตัวแปรในพารามิเตอร์ที่น่าสนใจ เป็น nowmore ปกติ ในที่กว้างขวาง และเอกสารประกอบการที่เติบโตใน ICC เน้นการประเมินเอกสารเป็นจำนวนมาก Donner (1986)แสดงภาพรวมของ estimators ผลอย่างต่อเนื่องและ Ridout et al. (1999) สำหรับไบนารีผลลัพธ์ที่ เอกสารไม่กี่ อย่างไรก็ตาม เน้นโดยเฉพาะนิยามของ ICC (Schemper1986 Commenges & Jacquin, 1994) หรือรักษาอย่างต่อเนื่อง และไบนารีผลกัน และไม่เน้นเอกสารที่กำหนดด้วยโปรแกรมประยุกต์เฉพาะ CRTsในเอกสารนี้ เรานำเสนอการสนทนารวมของคำนิยามของ ICC เน้นบน CRTs ใน2 ส่วนที่เรานำเสนอเป็นกรอบสำหรับการสนทนาของเรา แนะนำสมมติฐานเกี่ยวกับธรรมชาติของความสัมพันธ์ระหว่างวิชาภายในคลัสเตอร์ ซึ่งสอดคล้องกับข้อกำหนดทั่วไปของΡที่อาจแสดงได้หลายวิธีการสร้างแบบจำลองที่ใช้ในการกำหนดโครงสร้างของข้อมูล เราแสดงวิธีใช้ข้อกำหนดนี้ทั่วไปกับอย่างต่อเนื่อง (3 ส่วน)และ ผลลัพธ์ (4 ส่วน) dichotomous แสดงว่า มันมีความซับซ้อนมากขึ้นในบริบทหลังใน 5 ส่วน เราแสดงนิยามของρว่าแตกต่างกันเมื่อมีการแนะนำ covariates นี้เป็นที่เกี่ยวข้องกับ CRTs ในมุ่งที่ประสิทธิภาพมีเสมออย่างน้อยหนึ่งcovariate: สถานะทดลองใช้แขน ใน 6 ส่วน เราใช้ของเรากรอบและคำจำกัดความของρวาดออกผลกระทบสำหรับผู้ตีความ และเลือกค่าρเมื่อวาง CRTsนานาชาติสถิติตรวจทาน (2009), 77, 3, 378-394Cปี 2009 ผู้เขียน รวบรวมสมุดสถาบัน Statistical นานาชาติ 2009 C380 CARLIN S.M. ELDRIDGE, O.C. UKOUMUNNE และหรรษา2 คำนิยามทั่วไปของ ICCในการพัฒนากรอบกระดาษนี้ เราจำกัดการทดลองมีเพียงหนึ่งสนทนาของเราระดับของคลัสเตอร์ ตัวอย่างผู้ป่วย (สมาชิกในคลัสเตอร์) ในทางปฏิบัติทั่วไป (คลัสเตอร์) หรือนักเรียนที่ (สมาชิกในคลัสเตอร์) ภายในโรงเรียน (คลัสเตอร์) เราไม่พิจารณาสถานการณ์ด้วยซ้อนระดับของคลัสเตอร์ เช่นผู้ป่วยให้คำปรึกษากับ (สมาชิกในคลัสเตอร์ ระดับ 1) ในผู้ป่วย(กลุ่ม ระดับ 2) ในทางปฏิบัติทั่วไป (กลุ่ม ระดับ 3) ระดับการซ้อนกันของคลัสเตอร์อาจเกิดขึ้นในการสำรวจ (Gulliford et al., 1999), ทดลองตามชุมชน หรือโรงเรียน (มีดศิดดีกีย์ร้อยเอ็ด al., 1996), หรือ randomizing ปฏิบัติทั่วไป (Griffiths et al., 2004), แต่การศึกษาด้วยการทดลองระดับของคลัสเตอร์ทั่วไปได้คำนิยามพื้นฐานของ ICC ได้จากนิพจน์สำหรับสหสัมพันธ์ระหว่างการตอบสนองจากบุคคลทั้งสอง สมมติฐานพื้นฐานที่สองอยู่ภายใต้คำจำกัดความ: (i) ใด ๆตอบสองจากคลัสเตอร์ต่าง ๆ มีอิสระ แต่คู่ของการตอบสนองภายในคลัสเตอร์correlated และ (ii) ความสัมพันธ์ที่เหมือนกันสำหรับคู่ของแต่ละบุคคลจากคลัสเตอร์เดียวกันความสัมพันธ์ระหว่างการตอบสนอง j th และ l th ในคลัสเตอร์ไอ-th แล้วจะเขียนเป็น:Ρi = cov (Yij, Yil) /var(Yij) var(Yil) ∀ j = l. (1)อย่างไรก็ตาม ถ้าเราต้องการอาศัยรูปแบบของสหสัมพันธ์ ในคลัสเตอร์ลักษณะมีเหตุผลไม่คิดว่า ความแข็งแกร่งของความสัมพันธ์จะแตกต่างกันในคลัสเตอร์ใน aCRT และเรา ดังนั้น สมมติว่า มีρทั่วไปเดียวใช้กับคลัสเตอร์ทั้งหมด นี้สอดคล้องการที่มีเพิ่มการอธิบายในบริบทที่แตกต่างกันเป็นความสัมพันธ์ทั่วไป ผสมสมมาตร หรือ exchangeability อัสสัมชัญ (เหลียง & Zeger, 1986) ความสัมพันธ์ทั่วไปสมมติฐานหมายถึงการที่สามารถระงับการพึ่งฉันในสมการ (1) เพื่อให้เรามีความนิยามทั่วไปของ ICC เป็น:Ρ = cov (Yij, Yil) /var(Yij) var(Yil) ∀ j = l และ∀ฉัน (2)นิพจน์ของρที่นำเสนอในเอกสารนี้ทั้งหมดขึ้นอยู่กับสมการ (2)แบบพีชคณิตสำหรับนิพจน์ต่าง ๆ ของ ICC ขึ้นอยู่กับชนิดของผล และแบบจำลองที่ใช้อธิบายโครงสร้างข้อมูล แนวทางสร้างแบบจำลองหลักสองสำหรับข้อมูลจากCRTs จะ (i) แบบจำลองโครงสร้างความแปรปรวนร่วมของข้อมูล และ (ii) ให้คุณโดยตรง
การแปล กรุณารอสักครู่..
รีวิวทางสถิติระหว่างประเทศ (2009), 77, 3, 378-394 ดอย: 10.1111 / j.1751-5823.2009.00092.x
ค่าสัมประสิทธิ์สหสัมพันธ์ภายในคลัสเตอร์ในคลัสเตอร์แบบสุ่มทดลอง: ทบทวนของคำนิยามแซนดร้าเอ็มEldridge1, Obioha ซี Ukoumunne2 และจอห์นบี Carlin2 1Barts และลอนดอนโรงเรียนแพทย์และทันตกรรม, ควีนแมรี่มหาวิทยาลัยลอนดอน, สหราชอาณาจักรสถาบันวิจัย2Murdoch ของเด็กและภาควิชากุมารเวชศาสตร์มหาวิทยาลัยเมลเบิร์นประเทศออสเตรเลียE-mail: s.eldridge@qmul.ac.uk อย่างย่อภายในกลุ่มค่าสัมประสิทธิ์สหสัมพันธ์ (ICC) ของผลหลักที่มีบทบาทสำคัญในการออกแบบและวิเคราะห์การทดลองแบบสุ่มกลุ่ม(CRTs) แต่ความหมายที่ถูกต้องของพารามิเตอร์นี้เป็นที่เข้าใจยากบ้างโดยเฉพาะอย่างยิ่งในบริบทของการที่ไม่ปกติกระจายผลลัพธ์ ในบทความนี้เราให้การรักษาแบบครบวงจรของไอซีซีที่ใช้ใน CRTs เรานำเสนอความหมายทั่วไปของศาลอาญาระหว่างประเทศที่อาจจะแสดงในรูปแบบที่แตกต่างกันขึ้นอยู่กับวิธีการสร้างแบบจำลองที่ใช้ในการอธิบายข้อมูลที่แสดงวิธีการนิยามนี้ถูกนำไปใช้อย่างต่อเนื่องและผลdichotomous. ความซับซ้อนที่เกิดขึ้นส่วนใหญ่สำหรับผล dichotomous; โดยเฉพาะอย่างยิ่งความหมายปกติของ ICC ไม่สามารถจะเกี่ยวข้องโดยตรงกับพารามิเตอร์ของรูปแบบการโลจิสติกปกติที่ใช้กันทั่วไปสำหรับผล dichotomous เราแสดงให้เห็นว่าคำนิยามของไอซีซีที่มีความแตกต่างกันเมื่อตัวแปรมีการแนะนำให้รู้จัก สุดท้ายเราใช้กรอบและความหมายของ ICC ที่จะวาดออกความหมายสำหรับผู้ที่ตีความและการเลือกค่าของICC เมื่อมีการวางแผน CRTs. คำสำคัญ: ค่าสัมประสิทธิ์สหสัมพันธ์ภายในกลุ่ม; กลุ่มการทดลองแบบสุ่ม. 1 บทนำภายในกลุ่มค่าสัมประสิทธิ์สหสัมพันธ์(ICC) ของผลหลักที่มีบทบาทสำคัญในการออกแบบและวิเคราะห์การทดลองแบบสุ่มกลุ่ม(CRTs) ซึ่งในกลุ่มที่เช่นการดูแลสุขภาพองค์กรชั้นเรียนโรงเรียนหรือทางภูมิศาสตร์พื้นที่ที่มีการสุ่มให้แขนทดลองและผลการวัดที่อยู่ในกลุ่มบุคคลเหล่านั้น ศาลอาญาระหว่างประเทศ, มักแสดงρ, quantifies ระดับของความคล้ายคลึงกันในการตอบสนองของบุคคลจากกลุ่มเดียวกันสำหรับผล ในการออกแบบของ CRTs การประมาณการของρเป็นที่นิยมใช้ในการคำนวณปัจจัยเงินเฟ้อแปรปรวน (เนอร์และ Klar, 2000) ยังเป็นที่รู้จักผลการออกแบบ (คีช 1965) ซึ่งจะนำมาใช้เพื่อปรับขนาดของกลุ่มตัวอย่างที่จะจะจำเป็นสำหรับการพิจารณาคดีที่บุคคลที่สุ่มมากกว่ากลุ่ม. ในปีที่ผ่านมาได้มีการขยายตัวของเอกสารรายงานประมาณการของρต่างๆสำหรับผลลัพธ์และความแตกต่างของกลุ่มเพื่อความสะดวกในการออกแบบการทดลองในอนาคต ในทั้งเอกสาร ICCs คำนวณมักจะได้โดยตรงจากการทดลองเสร็จสิ้น (คอส et al, 2003;. Elley?.? C 2009 ผู้เขียนรวบรวม C วารสาร. 2009 ระหว่างสถาบันสถิติที่เผยแพร่โดยสำนักพิมพ์ Blackwell จำกัด 9600 Garsington ถนนOxford OX4 2DQ, สหราชอาณาจักรและ 350 ถนนสายหลัก Malden, MA 02148, USA. นิยามของความสัมพันธ์ภายในคลัสเตอร์ค่าสัมประสิทธิ์ 379 et al, 2005;. ปาร์กเกอร์, et al, 2005) แต่บางครั้งจากการสำรวจหรือข้อมูลการตรวจสอบ (อดัมส์, et al, 2004.. ;... แคมป์เบล, et al, 2005) และบางครั้งการตัวแปรเข้าบัญชี (อดัมส์, et al, 2004) วิธีการที่แตกต่างกันสามารถนำมาใช้ในการประเมิน ICCs (เนอร์, 1986. Ridout, et al, 1999) ตั้งแต่จากง่ายทางเดียวการวิเคราะห์ความแปรปรวน (เซิล, 1971) สำหรับการสำรวจและการตรวจสอบการแทรกแซงก่อนและควบคุมข้อมูลกลุ่มเดียวกับวิธีการถดถอยตามเมื่อข้อมูลที่โพสต์แทรกแซงจากแขนทดลองใช้และ/ หรือนักวิจัยต้องการที่จะปรับตัวแปร วิธีการถดถอยที่ใช้กันทั่วไปใช้ในการวิเคราะห์ข้อมูลจาก CRTs รวมถึงรูปแบบที่เหมาะสมโดยใช้ขอบทั่วไปสมการประเมิน(Gees) (เหลียงและ Zeger, 1986) และรูปแบบการใช้ผสมผลกระทบ maximumlikelihood ประมาณค่า (Goldstein, 1995) ผลกระทบที่ผสมรูปแบบนี้มักจะใช้ในการคำนวณICCs เมื่อคำนวณดังกล่าวเป็นจุดมุ่งหมายหลักของการวิเคราะห์ (อดัมส์, et al, 2004;.. Elley, et al, 2005) ตั้งแต่ ICC เกิดขึ้นตามธรรมชาติจากรูปแบบเหล่านี้ แต่ต่อไปนี้การวิเคราะห์ที่CRT โดยใช้แบบจำลองร่อแร่เช่นตามวิธี GEE, ICCs ก็อาจจะเป็นที่คาดกันว่าเป็นผลพลอยได้จากการวิเคราะห์ สมมติฐานหนุนผลกระทบแบบผสมและการวิเคราะห์วิธีการแปรปรวนไม่อนุญาตให้ ICCs จริงที่จะเป็นเชิงลบแม้ว่ารูปแบบร่อแร่ไม่ มันเป็นที่เชื่อกันโดยทั่วไปว่าในบริบทของการสุ่มตัวอย่างกลุ่มและ CRTs ที่ ICCs จริงไม่น่าจะเป็นลบ(Ferrinho et al, 1992;. เนอร์และ Klar, 1994) สำหรับผล dichotomous มีหลักฐานเชิงประจักษ์สำหรับความสัมพันธ์ระหว่างρและความชุกโดยรวม(Gulliford et al., 2005) และความหมายของρอาจขึ้นอยู่กับชนิดของรูปแบบที่นำมาใช้ในการวิเคราะห์ข้อมูล(อีแวนส์ et al., 2001) . ดังนั้นการ ICC คาดจะได้รับในรูปแบบต่าง ๆ จากข้อมูลที่มีโครงสร้างที่แตกต่างกันและอาจขึ้นอยู่กับการตั้งค่าและรูปแบบที่นำมาใช้ มีการเล็ก ๆ น้อย ๆการอภิปรายของความเหมาะสมของประมาณการ ICC ที่แตกต่างกันในการวางแผน CRTs ได้. นอกจากใช้ใน CRTs มีร่างของวรรณกรรมที่กล่าวถึงแง่มุมของ ICC ในบริบทของปริมาณความน่าเชื่อถือของตราสาร (รวมทั้งระหว่างผู้ประเมินและ ภายในประเมินข้อตกลง(Bodian 1994; Streiner และนอร์แมน, 2003) และเป็นเนื้อเดียวกันภายในชั้นเรียนสำหรับทางพันธุกรรมลักษณะ(แฮร์ริส, 1913; Molenberghs et al, 1996;. Sham, 1998)) ในสาขาที่ทั้งสองวัดเป็นที่รู้จักกันเป็นค่าสัมประสิทธิ์สหสัมพันธ์ระหว่างระดับคำเก่าและทั่วไปมากกว่า intracluster ค่าสัมประสิทธิ์สหสัมพันธ์ มีมติในช่วงต้นกำเนิดของมันไม่เป็น (แวร์เนอร์, 1977; คาร์ลิน. et al, 1981; Schemper 1986; มุลเลอร์และ Buttner 1994; Streiner และนอร์แมน, 2003) เร็วที่สุดเท่าที่อ้างอิงเราจะสามารถหานำเสนอ ICC เป็นมาตรการบรรยายล้วนมีความคล้ายคลึงในลักษณะของคู่ของบุคคลใดๆ จากระดับเดียวกัน "ขณะที่เมื่อเทียบกับแบบสุ่มคู่จากประชากร(หรือจักรวาล) ซึ่งพวกเขาเป็น" (แฮร์ริส 1913 ) โดยไม่มีการสร้างแบบจำลองหรือสมมติฐานกระจายพื้นฐานการคำนวณ ในการร่วมกันกับวิวัฒนาการของหลายแนวคิดทางสถิติวิธีการแบบที่ใช้ในการที่น่าจะเป็นรุ่นที่ระบุไว้สำหรับตัวแปรพื้นฐานในแง่ของค่าพารามิเตอร์ของดอกเบี้ยเป็นปกติnowmore ในที่กว้างขวางและวรรณกรรมที่เจริญเติบโตบนศาลอาญาระหว่างประเทศเป็นจำนวนมากของเอกสารมุ่งเน้นไปที่การประมาณค่าของมัน เนอร์ (1986) ให้ภาพรวมของผลการประมาณค่าสำหรับอย่างต่อเนื่องและ Ridout et al, (1999) สำหรับไบนารีผล เอกสารไม่กี่ แต่มุ่งเน้นเฉพาะในความหมายของ ICC ที่ (Schemper, 1986; Commenges และ Jacquin, 1994) หรือรักษาผลอย่างต่อเนื่องและไบนารีร่วมกันและไม่มีเอกสารการมุ่งเน้นไปที่ความหมายกับแอพลิเคชันที่เฉพาะเจาะจงเพื่อCRTs. ในบทความนี้เรานำเสนอ การอภิปรายแบบครบวงจรของความหมายของศาลอาญาระหว่างประเทศมุ่งเน้นไปที่ CRTs ในส่วนที่ 2 เรานำเสนอกรอบการทำงานสำหรับการสนทนาของเราแนะนำสมมติฐานเกี่ยวกับธรรมชาติของความสัมพันธ์ระหว่างเรื่องภายในกลุ่มซึ่งสอดคล้องกับความหมายทั่วไปของρที่อาจจะแสดงในรูปแบบที่แตกต่างกันขึ้นอยู่กับวิธีการสร้างแบบจำลองที่ใช้ในการกำหนดโครงสร้างข้อมูล. เราแสดงให้เห็นว่านิยามนี้ถูกนำไปใช้อย่างต่อเนื่อง (มาตรา 3) และทวิลักษณ์ (มาตรา 4) ผลลัพธ์ที่แสดงให้เห็นว่ามันมีความซับซ้อนมากขึ้นในบริบทหลัง. ในมาตรา 5 ที่เราแสดงให้เห็นว่าคำนิยามของρที่แตกต่างกันเมื่อตัวแปรจะนำ นี้โดยเฉพาะอย่างยิ่งที่เกี่ยวข้องกับเรามุ่งเน้นที่ CRTs ได้อย่างมีประสิทธิภาพที่มีอยู่เสมออย่างน้อยหนึ่งตัวแปรร่วม: สถานะแขนทดลอง ในมาตรา 6 ที่เราใช้กรอบการทำงานและความหมายของρของเราที่จะวาดออกความหมายสำหรับผู้ตีความและการเลือกค่าρเมื่อมีการวางแผนCRTs. ทางสถิติระหว่างประเทศทบทวน (2009), 77, 3, 378-394 องศาเซลเซียส2009 ผู้เขียน รวบรวมวารสาร C? 2009 ระหว่างสถาบันสถิติ380 SM ELDRIDGE, OC UKOUMUNNE & JB CARLIN 2 ทั่วไปหมายของศาลอาญาระหว่างประเทศในการพัฒนากรอบสำหรับบทความนี้เราจำกัด การสนทนาของเราในการทดลองที่มีเพียงหนึ่งระดับของการจัดกลุ่มสำหรับผู้ป่วยตัวอย่างเช่น(สมาชิกคลัสเตอร์) ภายในการปฏิบัติทั่วไป (กลุ่ม) หรือนักเรียน(สมาชิกคลัสเตอร์) ภายในโรงเรียน (กลุ่ม) เราไม่ได้พิจารณาสถานการณ์ที่ซ้อนกันกับระดับของการจัดกลุ่มเช่นการให้คำปรึกษาผู้ป่วย (สมาชิกคลัสเตอร์ระดับ 1) ภายในผู้ป่วย (กลุ่มระดับที่ 2) ภายในการปฏิบัติทั่วไป (กลุ่มระดับ 3) ระดับของการจัดกลุ่มที่ซ้อนกันอาจเกิดขึ้นในการสำรวจที่ซับซ้อน (Gulliford et al., 1999) การทดลองชุมชนหรือโรงเรียนตาม (Siddiqui et al., 1996) หรือการทดลองสุ่มการปฏิบัติทั่วไป (Griffiths et al., 2004) แต่การศึกษา กับระดับของการจัดกลุ่มจะมีอยู่มาก. ความหมายพื้นฐานของศาลอาญาระหว่างประเทศที่ได้มาจากการแสดงออกสำหรับความสัมพันธ์ระหว่างการตอบสนองจากบุคคลทั้งสอง สองสมมติฐานพื้นฐานรองรับความหมาย: (i) ใด ๆ ที่สองการตอบสนองจากกลุ่มที่แตกต่างกันมีความเป็นอิสระแต่คู่ของการตอบสนองภายในกลุ่มจะ. มีความสัมพันธ์และ (ii) ความสัมพันธ์จะเหมือนกันสำหรับทุกคู่ของบุคคลจากกลุ่มเดียวกันความสัมพันธ์ระหว่างการตอบสนองที่ j และ l-ส่วนในกลุ่มที่ i จากนั้นสามารถเขียนเป็น: ρi = COV (Yij, Yil) /? var (Yij) var (Yil) เจ∀ = ลิตร? (1) แต่ถ้าเราต้องการที่จะแบบพึ่งพาอาศัยกันของความสัมพันธ์ในลักษณะคลัสเตอร์มีเหตุผลที่จะคิดว่าความแข็งแรงของความสัมพันธ์จะแตกต่างกันระหว่างกลุ่มที่ไม่มีใน aCRT และเราจึงคิดว่ามีทั่วไปเดียวρใช้เพื่อให้ทุกกลุ่ม นี้สอดคล้องกับสิ่งที่ได้รับการอธิบายความแตกต่างในบริบทที่แตกต่างกันเป็นความสัมพันธ์ทั่วไปสารประกอบสมมาตรหรือสมมติฐานexchangeability (เหลียงและ Zeger, 1986) ความสัมพันธ์ร่วมกันสมมติฐานที่แสดงให้เห็นว่าการพึ่งพาฉันในสมการที่ (1) สามารถระงับเพื่อให้เรามีความหมายทั่วไปของICC เป็น: ρ = COV (Yij, Yil) /? var (Yij) var (Yil) ∀ญ ? = ลิตรและ∀ฉัน (2) การแสดงออกทั้งหมดρนำเสนอในบทความนี้จะขึ้นอยู่กับสมการ (2). รูปแบบพีชคณิตสำหรับการแสดงออกที่แตกต่างกันของไอซีซีขึ้นอยู่กับชนิดของผลและรูปแบบที่ใช้ในการอธิบายโครงสร้างข้อมูล ทั้งสองวิธีการสร้างแบบจำลองหลักสำหรับข้อมูลจากCRTs มี (i) การจำลองโครงสร้างโดยตรงแปรปรวนในข้อมูลและ (ii) เพื่อท่าน
การแปล กรุณารอสักครู่..