Plotting positions[edit]
The choice of quantiles from a theoretical distribution can depend upon context and purpose. One choice, given a sample of size n, is k / n for k = 1, …, n, as these are the quantiles that the sampling distribution realizes. The last of these, n / n, corresponds to the 100th percentile – the maximum value of the theoretical distribution, which is sometimes infinite. Other choices are the use of (k − 0.5) / n, or instead to space the points evenly in the uniform distribution, using k / (n + 1).[6] Many other choices have been suggested, both formal and heuristic, based on theory or simulations relevant in context. The following subsections discuss some of these.
Expected value of the order statistic[edit]
In using a normal probability plot, the quantiles one uses are the rankits, the quantile of the expected value of the order statistic of a standard normal distribution.
More generally, Shapiro–Wilk test uses the expected values of the order statistics of the given distribution; the resulting plot and line yields the generalized least squares estimate for location and scale (from the intercept and slope of the fitted line).[3] Although this is not too important for the normal distribution (the location and scale are estimated by the mean and standard deviation, respectively), it can be useful for many other distributions.
However, this requires calculating the expected values of the order statistic, which may be difficult if the distribution is not normal.
Median of the order statistics[edit]
Alternatively, one may use estimates of the median of the order statistics, which one can compute based on estimates of the median of the order statistics of a uniform distribution and the quantile function of the distribution; this was suggested by (Filliben 1975).[3]
This can be easily generated for any distribution for which the quantile function can be computed, but conversely the resulting estimates of location and scale are no longer precisely the least squares estimates, though these only differ significantly for n small.
Heuristics[edit]
For the quantiles of the comparison distribution typically the formula k / (n + 1) is used. Several different formulas have been used or proposed as symmetrical plotting positions. Such formulas have the form (k − a) / (n + 1 − 2a) for some value of a in the range from 0 to 1/2, which gives a range between k / (n + 1) and (k − 1/2) / n.
Other expressions include:
(k − 0.3) / (n + 0.4).[7]
(k − 0.3175) / (n + 0.365).[8]
(k − 0.326) / (n + 0.348).[9]
(k − ⅓) / (n + ⅓).[10]
(k − 0.375) / (n + 0.25).[11]
(k − 0.4) / (n + 0.2).[12]
(k − 0.44) / (n + 0.12).[13]
(k − 0.5) / (n).[14]
(k − 0.567) / (n − 0.134).[15]
(k − 1) / (n − 1).[16]
For large sample size, n, there is little difference between these various expressions.
Filliben's estimate[edit]
The order statistic medians are the medians of the order statistics of the distribution. These can be expressed in terms of the quantile function and the order statistic medians for the continuous uniform distribution by:
N(i) = G(U(i))
where U(i) are the uniform order statistic medians and G is the quantile function for the desired distribution. The quantile function is the inverse of the cumulative distribution function (probability that X is less than or equal to some value). That is, given a probability, we want the corresponding quantile of the cumulative distribution function.
James J. Filliben (Filliben 1975) uses the following estimates for the uniform order statistic medians:
m(i) = egin{cases} 1 - m(n) & i = 1\ \
dfrac{i - 0.3175}{n + 0.365} & i = 2, 3, ldots, n-1\ \
0.5^{1/n} & i = n.end{cases}
The reason for this estimate is that the order statistic medians do not have a simple form.
พล็อตตำแหน่ง [แก้ไข]เลือก quantiles จากการกระจายทฤษฎีสามารถขึ้นบริบทและวัตถุประสงค์ ทางเลือกหนึ่ง กำหนดให้ตัวอย่างขนาด n คือ k / n สำหรับ k = 1,..., n เหล่านี้เป็น quantiles ที่ตระหนักถึงการกระจายการสุ่มตัวอย่าง สุดท้ายเหล่านี้ n / n สอดคล้องกับ percentile 100 ค่าสูงสุดของการกระจายทฤษฎี ซึ่งบางครั้งไม่ ตัวเลือกอื่น ๆ ใช้ (k − 0.5) / n หรือแทนพื้นที่สถานอย่างสม่ำเสมอในการกระจายสม่ำเสมอ ใช้ k / (n + 1) [6] มีตัวเลือกอื่น ๆ มีการแนะนำ แล้ว และทางทฤษฎีหรือที่เกี่ยวข้องในบริบทจำลอง ส่วนย่อยต่อไปนี้กล่าวถึงเหล่านี้ค่าคาดหมายของสถิติใบสั่ง [แก้ไข]ใช้พล็อตความน่าเป็นปกติ quantiles ที่ใช้เป็น rankits, quantile ของค่าคาดหมายของสถิติใบสั่งการกระจายปกติมาตรฐานเพิ่มเติมโดยทั่วไป ทดสอบ Shapiro – Wilk ใช้ค่าคาดหมายของสถิติใบสั่งการกระจายที่กำหนด พล็อตผลลัพธ์และบรรทัดทำให้การประเมินกำลังสองน้อยสุดเมจแบบทั่วไปสำหรับตำแหน่งและมาตราส่วน (จากจุดตัดแกนและความชันของเส้นผ่อน) [3] แม้ว่าจะไม่สำคัญเกินไปสำหรับการแจกแจงปกติ (สถานที่ตั้งและขนาดจะประมาณค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐาน ตามลำดับ), มันจะมีประโยชน์สำหรับการกระจายหลายอื่น ๆอย่างไรก็ตาม นี้ต้องคำนวณค่าคาดหมายของสถิติใบสั่ง ซึ่งอาจจะมองว่าการแจกแจงแบบไม่ปกติค่ามัธยฐานสถิติใบสั่ง [แก้ไข]หรือ หนึ่งอาจใช้การประเมินค่ามัธยฐานลำดับสถิติ ที่หนึ่งสามารถคำนวณตามการประเมินของค่ามัธยฐานสถิติใบสั่งการกระจายสม่ำเสมอและฟังก์ชัน quantile กระจาย นี้ถูกแนะนำ โดย (Filliben 1975) [3]นี้ได้สร้างการแจกจ่ายใด ๆ ซึ่งสามารถจะคำนวณฟังก์ชัน quantile แต่ตรงกันข้าม การประเมินผลของที่ตั้งและขนาดจะไม่แม่นยำประเมินกำลังสองน้อยสุด แม้เพียงแตกต่างกันอย่างมีนัยสำคัญสำหรับ n เล็กลองผิดลองถูก [แก้ไข]สำหรับ quantiles ของการกระจายการเปรียบเทียบโดยทั่วไป k สูตร / (n + 1) จะใช้ หลายสูตรแตกต่างกันมีการใช้ หรือนำเสนอเป็นพล็อตตำแหน่งสมมาตร สูตรดังกล่าวมีแบบฟอร์ม (k −) / (n + 1 − 2a) สำหรับบางค่าของตัวในช่วงตั้งแต่ 0 ถึง 1/2 ซึ่งช่วยให้ช่วงระหว่าง k / (n + 1) และ (k − 1/2) / nนิพจน์อื่น ๆ รวมถึง:(k − 0.3) / (n + 0.4) [7](k − 0.3175) / (n + 0.365) [8](k − 0.326) / (n + 0.348) [9](k − ⅓) / (n + ⅓). [10](k − 0.375) / (n + 0.25) [11](k − 0.4) / (n + 0.2) [12](k − 0.44) / (n + 0.12) [13](k − 0.5) / (n) [14](k − 0.567) / (n − 0.134) [15](k − 1) / (n − 1) [16]สำหรับขนาดตัวอย่างขนาดใหญ่ n มีความแตกต่างเล็กน้อยระหว่างนิพจน์ต่าง ๆ เหล่านี้ประเมินของ Filliben [แก้ไข]Medians สถิติใบสั่ง medians สั่งสถิติของการกระจายได้ เหล่านี้สามารถแสดงในรูปของฟังก์ชัน quantile และ medians สถิติใบสั่งการกระจายที่สม่ำเสมออย่างต่อเนื่องโดย:N(i) = G(U(i))ที่ U(i) มี medians สถิติสั่งสม่ำเสมอ และ G เป็นฟังก์ชัน quantile แจกต้อง ฟังก์ชัน quantile เป็นค่าผกผันของฟังก์ชันการแจกแจงสะสม (น่าเป็นที่ X น้อยกว่า หรือเท่ากับค่าบาง) เราต้องการ quantile สอดคล้องกันของฟังก์ชันการแจกแจงสะสมคือ กำหนดความน่าเป็นJames J. Filliben (Filliben 1975) ใช้ประเมินต่อไปนี้สำหรับ medians สถิติสั่งสม่ำเสมอ:m(i) = egin{cases } 1 - m(n) แอนด์ไอ = 1\ \ dfrac{i - 0.3175 } {n + 0.365 } และฉัน = 2, 3, ldots, n 1\ \ 0.5 ^ {1 n } และฉัน = end ตอนเหนือ {กรณี}เหตุผลของการประเมินนี้ได้ที่ medians สถิติใบสั่งได้แบบง่าย ๆ
การแปล กรุณารอสักครู่..

วางแผนตำแหน่ง [ แก้ไข ]
ทางเลือกของ quantiles จากการแจกแจงทางทฤษฎีจะขึ้นอยู่กับบริบทและวัตถุประสงค์ ทางเลือกหนึ่งให้ตัวอย่างขนาด n , k / N สำหรับ k = 1 , . . . , n , ที่เป็นเหล่านี้จะ quantiles ที่สุ่มแจกตระหนัก . สุดท้ายของเหล่านี้ , n / n , สอดคล้องกับ 100 เปอร์เซ็นต์–คุณค่าสูงสุดของการแจกแจงทางทฤษฎี ซึ่งบางครั้งที่อนันต์ตัวเลือกอื่น ๆมีการใช้ ( K ( − 0 ) / N หรือแทนพื้นที่จุดอย่างทั่วถึงในการกระจายสม่ำเสมอ ใช้ K / ( 1 ) [ 6 ] หลายตัวเลือกอื่น ๆได้แนะนำ ทั้งอย่างเป็นทางการ และแบ่งตามทฤษฎีหรือแบบจำลองที่เกี่ยวข้องในบริบท ในอนุมาตราต่อไปนี้กล่าวถึงบางส่วนของเหล่านี้
คาดว่ามูลค่าของสถิติคำสั่ง [ แก้ไข ]
ใช้พล็อตน่าจะเป็นปกติการ quantiles หนึ่งใช้เป็น rankits , ควอนไทล์ของค่าคาดหวังของคำสั่งสถิติการแจกแจงแบบปกติมาตรฐาน
โดยทั่วไป Shapiro –ตัวแทนทดสอบใช้คาดว่าค่าสถิติเพื่อของรับแจกจ่าย อันเป็นพล็อตและสายผลผลิต Generalized Least Squares ประมาณการที่ตั้งและขนาด ( จาก สกัดกั้นและความชันของเข็มขัดเส้น )[ 3 ] แม้ว่านี้ไม่ได้เป็นสิ่งสำคัญสำหรับการแจกแจงแบบปกติ ( ที่ตั้งและขนาดจะคำนวณจากค่าเฉลี่ย และส่วนเบี่ยงเบนมาตรฐาน ตามลำดับ ) , มันสามารถเป็นประโยชน์สำหรับการแจกแจงอื่น ๆอีกมากมาย
แต่นี้ต้องมีการคำนวณคาดว่าค่าของการสั่งซื้อทั้งหมด ซึ่งอาจจะยากถ้าการแจกแจงไม่ปกติ
เฉลี่ยของสถิติเพื่อ [ แก้ไข ]
อีกวิธีหนึ่งคือหนึ่งอาจจะใช้ประมาณการค่ามัธยฐานของสถิติเพื่อที่หนึ่งสามารถคำนวณตามประมาณการค่ามัธยฐานของคำสั่งสถิติการแจกแจงและฟังก์ชันควอนไทล์ของการกระจาย ; นี้เป็นข้อเสนอแนะโดย ( filliben 1975 ) . [ 3 ]
นี้สามารถสร้างการกระจายใด ๆซึ่งควอนไทล์ฟังก์ชันที่สามารถคำนวณแต่ในทางกลับกันส่งผลให้ประมาณการของที่ตั้งและขนาดจะไม่แน่นอนอย่างน้อยประมาณ แม้ว่าเหล่านี้แตกต่างกันสำหรับ n เล็ก
ฮิวริสติก [ แก้ไข ]
สำหรับ quantiles การกระจายโดยทั่วไปสูตร k / ( 1 ) ใช้ หลายสูตรมีการใช้หรือเสนอเป็นสมมาตร วางแผนตำแหน่งสูตรดังกล่าวมีรูปแบบ ( K ( − ( − 1 ) / 2A ) บางค่าในช่วง 0 ถึง 1 / 2 ซึ่งจะช่วยให้ช่วงระหว่าง k / ( 1 ) และ ( K − 1 / 2 ) / n
สำนวนอื่น ๆรวมถึง :
( K ( − 0.3 ) / ( 0.4 ) [ 7 ]
( K ( − 0.3175 ) / ( 0.110 ) [ 8 ]
( K ( − 0.326 ) / ( 0.348 ) [ 9 ]
( K ( −⅓ ) / ( N ⅓ ) [ 10 ]
( K ( − ) ) / ( 0.25 ) [ 11 ]
( K ( − 0.4 ) / ( 2 ) [ 12 ]
( K ( − 044 ) / ( 0.12 ) . [ 13 ]
( K ( − 0 ) / ( N ) [ 14 ]
( K ( − 0.567 ) / ( n − 0.134 ) [ 15 ]
( K ( − 1 ) / ( − 1 ) [ 16 ]
ขนาดตัวอย่างใหญ่ ๆ มีความแตกต่างเล็กน้อยระหว่างการแสดงออกต่าง ๆเหล่านี้ เป็นส่วน filliben
[ แก้ไข ] เพื่อสถิติมีเดียเป็นมีเดียของคำสั่งสถิติของการกระจาย .เหล่านี้สามารถแสดงออกในแง่ของฟังก์ชันควอนไทล์และสถิติคำสั่งมีเดียสำหรับต่อเนื่องการแจกแจงเอกรูปโดย :
n ( i ) = g ( u ( i )
ที่ ( ฉัน ) เป็นคำสั่งชุดสถิติมีเดียและ g เป็นฟังก์ชันควอนไทล์เพื่อที่ต้องการ การกระจายสินค้า ฟังก์ชันควอนไทล์เป็นผกผันของฟังก์ชันการแจกแจงสะสม ( ความน่าจะเป็นที่ x น้อยกว่าหรือเท่ากับค่า )ที่ให้โอกาสเราต้องการควอนไทล์ที่สอดคล้องกันของฟังก์ชันการแจกแจงสะสม
เจมส์เจ. filliben ( filliben 1975 ) ใช้ตามประมาณการสำหรับการสั่งซื้อชุดสถิติมีเดีย :
M ( i ) = เริ่มคดี } { 1 M ( n ) = 1 &
dfrac { ผม } { n } 0.3175 0.110 & = 2 , 3 , ldots N - 1 ,
0
{ 1 / n } = N & }
{ กรณีสิ้นสุดเหตุผลประมาณนี้ คือว่า คำสั่งสถิติมีเดียไม่ได้มีรูปแบบเรียบง่าย
การแปล กรุณารอสักครู่..
