Nowadays there are several reasons for replacing the MVE by the minimum covariance
determinant (MCD) estimator, which was also proposed in (Rousseeuw 1984, page 877;
1985). The MCD objective is to nd h observations (out of n) whose classical covariance
matrix has the lowest determinant. The MCD estimate of location is then the average
of these h points, whereas the MCD estimate of scatter is their covariance matrix. The
resulting breakdown value equals that of the MVE, but the MCD has several advantages
over the MVE. Its statistical eciency is better, because the MCD is asymptotically normal
(Butler, Davies and Jhun 1993; Croux and Haesbroeck 1998) whereas the MVE has a lower
convergence rate (Davies 1992). As an example, the asymptotic eciency of the MCD scatter
matrix with the typical coverage h = 0:75n is 44% in 10 dimensions, and the reweighted
covariance matrix with weights obtained from the MCD attains 83% of eciency (Croux
and Haesbroeck 1998), whereas the MVE attains 0%. The MCD's better accuracy makes it
very useful as an initial estimate for one-step regression estimators (Simpson, Ruppert and
Carroll 1992; Coakley and Hettmansperger 1993). Robust distances based on the MCD are
more precise than those based on the MVE, and hence better suited to expose multivariate
outliers, e.g. in the diagnostic plot of Rousseeuw and van Zomeren (1990) which displays
robust residuals versus robust distances. Moreover, the MCD is a key component of the
hybrid estimators of (Woodru and Rocke 1994) and (Rocke and Woodru 1996), and of
high-breakdown linear discriminant analysis (Hawkins and McLachlan 1997).
ในปัจจุบัน มีหลายเหตุผลสำหรับการเปลี่ยน mve โดยร่วมน้อยกำหนด ( MCD ) ประมาณการ ซึ่งได้นำเสนอใน ( rousseeuw 1984 , หน้า 877 ;1985 ) โดยมีวัตถุประสงค์เพื่อสังเกตและ MCD H ( N ) ที่มีความคลาสสิกเมทริกซ์ดีเทอร์มิแนนต์ได้ถูกที่สุด การประมาณการของสถานที่เป็น MCD แล้วเฉลี่ยจุด H เหล่านี้ ในขณะที่การกระจายของความแปรปรวนร่วม MCD เมทริกซ์ ที่ซึ่งเท่ากับค่ารายละเอียดของ mve , แต่ MCD มีข้อดีหลายผ่าน mve . สถิติของ eciency จะดีกว่า เพราะ asymptotically MCD เป็นปกติ( คนรับใช้ เดวี่ส์และ jhun 1993 ; croux และ haesbroeck 1998 ) ในขณะที่ mve ได้ต่ำกว่าอัตราการลู่เข้า ( เดวีส์ 1992 ) เป็นตัวอย่าง , eciency เฉลี่ยของ MCD ที่กระจัดกระจายเมทริกซ์กับโดยทั่วไปครอบคลุม H = 0:75n ร้อยละ 44 ใน 10 มิติ และ reweightedความแปรปรวนร่วมเกี่ยวกับน้ำหนักที่ได้จาก MCD ได้ 83% ของ eciency ( crouxhaesbroeck และ 1998 ) , ในขณะที่ mve ได้ 0 % ของ MCD ความถูกต้องทำให้ดีกว่ามีประโยชน์มาก เป็นประมาณการครั้งแรกสำหรับขั้นตอนหนึ่งตัวประมาณการถดถอย ( Simpson Ruppert และแคร์โรลล์ ปี 1992 และ 1993 ; โคกลีย์ hettmansperger ) ( ระยะทางขึ้นอยู่กับ MCD คือแม่นยำมากกว่านั้นขึ้นอยู่กับ mve , และดังนั้นจึงเหมาะกับการเปิดเผยหลายตัวแปรผิดปกติ เช่นในเรื่องการวินิจฉัยและ rousseeuw รถตู้ zomeren ( 1990 ) ซึ่งแสดงค่าประสิทธิภาพที่แข็งแกร่งเมื่อเทียบกับระยะทาง นอกจากนี้ MCD เป็นองค์ประกอบสำคัญของไฮบริด ( และประมาณ woodru เป็น 1994 ) และ ( เป็น และ woodru 1996 ) , และรายละเอียดสูงเชิงเส้นการวิเคราะห์จำแนกประเภท ( Hawkins และแมคลาชแลน 1997 )
การแปล กรุณารอสักครู่..