The normal probability plot, sometimes called the qq plot, is a graphical way of assessing whether a set of data looks like it might come from a standard bell shaped curve (normal distribution). To compute a normal probability plot, first sort your data, then compute evenly spaced percentiles from a normal distribution. Optionally, you can choose the normal distribution to have the same mean and standard deviation as your data, or you can save some time by using evenly spaced percentiles from a standard normal distribution. Finally, plot the evenly spaced percentiles versus the sorted data. A reasonably straight line indicates a distribution that is close to normal. A markedly curved line indicates a distribution that deviates from normality.
Here's an example. The following data set represents a simulation from a non-normal distribution.
31 88 23 44 35 26 66 92 32
Sort the data.
23 26 31 32 35 44 66 88 92
Calculate evenly spaced percentiles. There are several formulas that will produce evenly spaced percentiles. I like the formula i/(n+1). With 9 observations, that would produce the 10th, 20th, 30th,...90th percentiles. Another commonly used formula for evenly spaced percentiles is (i-0.5)/10. This would produce the 6th, 17th, 28th, 39th, 50th, 61st, 72, 83rd, and 94th percentiles. Don't worry about the different formulas. In practice, they produce very similar results.
Here are the percentiles from the standard normal distribution.
-1.28 -0.84 -0.52 -0.25 0.00 0.25 0.52 0.84 1.28
Here are the percentiles from a normal distribution with the same mean and standard deviation as the data. I line these up with the sorted values
23 26 31 32 35 44 66 88 92 (sorted values)
14 26 35 42 49 55 63 71 83 (normal percentiles)
Here's how R produces a normal probability plot.
The normal probability plot, sometimes called the qq plot, is a graphical way of assessing whether a set of data looks like it might come from a standard bell shaped curve (normal distribution). To compute a normal probability plot, first sort your data, then compute evenly spaced percentiles from a normal distribution. Optionally, you can choose the normal distribution to have the same mean and standard deviation as your data, or you can save some time by using evenly spaced percentiles from a standard normal distribution. Finally, plot the evenly spaced percentiles versus the sorted data. A reasonably straight line indicates a distribution that is close to normal. A markedly curved line indicates a distribution that deviates from normality.Here's an example. The following data set represents a simulation from a non-normal distribution.31 88 23 44 35 26 66 92 32Sort the data.23 26 31 32 35 44 66 88 92Calculate evenly spaced percentiles. There are several formulas that will produce evenly spaced percentiles. I like the formula i/(n+1). With 9 observations, that would produce the 10th, 20th, 30th,...90th percentiles. Another commonly used formula for evenly spaced percentiles is (i-0.5)/10. This would produce the 6th, 17th, 28th, 39th, 50th, 61st, 72, 83rd, and 94th percentiles. Don't worry about the different formulas. In practice, they produce very similar results.Here are the percentiles from the standard normal distribution.-1.28 -0.84 -0.52 -0.25 0.00 0.25 0.52 0.84 1.28Here are the percentiles from a normal distribution with the same mean and standard deviation as the data. I line these up with the sorted values23 26 31 32 35 44 66 88 92 (sorted values)14 26 35 42 49 55 63 71 83 (normal percentiles)Here's how R produces a normal probability plot.
การแปล กรุณารอสักครู่..

พล็อตน่าจะเป็นปกติบางครั้งเรียกว่าพล็อต QQ, เป็นวิธีที่กราฟิกของการประเมินไม่ว่าจะเป็นชุดของข้อมูลที่ดูเหมือนว่ามันอาจจะมาจากระฆังมาตรฐานรูปโค้ง (การกระจายปกติ) การคำนวณความน่าจะเป็นพล็อตปกติแรกเรียงลำดับข้อมูลของคุณแล้วคำนวณเปอร์เซนต์เว้นระยะเท่ากันจากการแจกแจงแบบปกติ หรือคุณสามารถเลือกการกระจายปกติที่จะมีการเบี่ยงเบนเดียวกันหมายและมาตรฐานตามที่ข้อมูลของคุณหรือคุณสามารถประหยัดเวลาบางอย่างโดยใช้เปอร์เซนต์เว้นระยะเท่ากันจากการแจกแจงแบบปกติมาตรฐาน ในที่สุดพล็อตเปอร์เซนต์เว้นระยะเท่ากันเมื่อเทียบกับข้อมูลที่เรียง สายตรงพอสมควรแสดงให้เห็นการกระจายที่ใกล้เคียงกับปกติ เส้นโค้งอย่างเห็นได้ชัดแสดงให้เห็นการกระจายที่เบี่ยงเบนไปจากปกติได้. นี่คือตัวอย่าง ชุดข้อมูลต่อไปนี้แสดงให้เห็นถึงการจำลองจากการกระจายไม่ปกติ. วันที่ 31 88 23 44 35 26 66 92 32 จัดเรียงข้อมูล. 23 26 31 32 35 44 66 88 92 คำนวณเว้นระยะเท่ากันเปอร์เซนต์ มีหลายสูตรที่จะผลิตเปอร์เซนต์เว้นระยะเท่ากันอยู่ ผมชอบสูตรผม / (n + 1) 9 ข้อสังเกตที่จะผลิต 10, 20, 30 ... 90 เปอร์เซนต์ อีกสูตรที่ใช้กันทั่วไปสำหรับเปอร์เซนต์เว้นระยะเท่ากันคือ (i-0.5) / 10 นี้จะผลิตที่ 6, 17, 28, 39, 50, 61, 72, 83 และ 94 เปอร์เซนต์ ไม่ต้องกังวลเกี่ยวกับสูตรที่แตกต่างกัน ในทางปฏิบัติที่พวกเขาก่อให้เกิดผลที่คล้ายกันมาก. ที่นี่มีเปอร์เซนต์จากการกระจายปกติมาตรฐาน. -1.28 -0.84 -0.52 -0.25 0.00 0.25 0.52 0.84 1.28 ต่อไปนี้เป็นเปอร์เซนต์จากการแจกแจงแบบปกติที่มีความหมายเหมือนกันและส่วนเบี่ยงเบนมาตรฐานเป็นข้อมูลที่ . ผมเส้นเหล่านี้ขึ้นกับค่านิยมเรียง23 26 31 32 35 44 66 88 92 (ค่าเรียงลำดับ) 14 26 35 42 49 55 63 71 83 (เปอร์เซนต์ปกติ) นี่คือวิธีการผลิต R พล็อตน่าจะเป็นปกติ
การแปล กรุณารอสักครู่..

พล็อตน่าจะเป็นปกติ บางครั้งเรียกว่า QQ แปลง เป็นวิธีแบบประเมินว่าชุดของข้อมูลที่ดูเหมือนจะมาจากมาตรฐานเส้นโค้งรูประฆัง ( ปกติ ) คำนวณพล็อตน่าจะเป็นปกติ ก่อน เรียงข้อมูลแล้วคำนวณเว้นระยะเท่ากันเปอร์เซ็นต์จากการแจกแจงแบบปกติ เลือกคุณสามารถเลือกการแจกแจงแบบปกติที่มีค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐานเป็นข้อมูลเดิมของคุณ หรือคุณสามารถประหยัดเวลาโดยการเว้นระยะเท่ากัน ได้แก่ ความถี่ จากมาตรฐานปกติกระจาย ในที่สุดพล็อตเว้นระยะเท่ากันเปอร์เซ็นต์เมื่อเทียบกับเรียงข้อมูล เส้นแสดงการกระจายที่เหมาะสมตรงใกล้ปกติอย่างเห็นได้ชัดเส้นโค้งแสดงการกระจายที่เบี่ยงเบนไปจากปกติ
ที่นี่คือตัวอย่าง ข้อมูลต่อไปนี้แสดงการตั้งค่าจากไม่มีการแจกแจงแบบปกติ
31 88 23 44 35 26 66 92 32
การจัดเรียงข้อมูล
23 26 31 32 35 44 66 88 92 เว้นระยะเท่ากัน
คำนวณเปอร์เซ็นต์ มีสูตรต่าง ๆ ที่จะผลิตเว้นระยะเท่ากันเป็นเปอร์เซ็นต์ ผมชอบสูตรผม / ( 1 )9 สังเกตว่า จะผลิต 10 , 20 , 30 , 90 เปอร์เซ็นต์ . . . . . . . . อื่นที่นิยมใช้สูตรสำหรับเว้นระยะเท่ากัน ได้แก่ ความถี่ ( i-0.5 ) / 10 นี้จะผลิต 6 , 17 , 28 , 50 , 39 , 61 , 72 , 83 , 94 เปอร์เซ็นต์ ไม่ต้องกังวลเกี่ยวกับสูตรที่แตกต่างกัน ในการปฏิบัติ พวกเขาผลิตผลที่คล้ายกันมาก
ที่นี่มีเปอร์เซ็นต์จากการแจกแจงปกติมาตรฐาน
-1.28 -0.84 -0.52 การจัดประเภท 0.00 0.25 0.52 0.84 1.28
นี่เป็นเปอร์เซ็นต์จากการแจกแจงแบบปกติที่มีค่าเฉลี่ย และส่วนเบี่ยงเบนมาตรฐานเป็นข้อมูล ผมสายเหล่านี้กับเรียงค่า
23 26 31 32 35 44 66 88 92 ( เรียงค่า )
14 26 35 42 49 55 63 71 83 ( เปอร์เซ็นไทล์ปกติ )
นี่เป็นวิธีที่ R สร้างพล็อตน่าจะเป็นปกติ
การแปล กรุณารอสักครู่..
