Normal Plots
Introduction
We know that a bell-shaped histogram is said to have a normal distribution.
However, in practice, it is often difficult to look at a histogram and determine how close its distribution is to normal.
An easier way to tell if a dataset is normally distributed is to look at the normal plot. If the normal plot is close to a straight line, the distribution of the dataset is close to normal.
Normal Scores
To define normal scores using Van der Waerden's method, find z-scores that divide the standard normal curve into n+1 equal areas of 1/(n+1) each. For example, the normal scores when n = 5 are defined by the bins (-∞, -0.97], (-0.97, -0.43], (-0.43, 0.00], (0.00, 0.43], [0.43, 0.97], (0.97, ∞). Each of these bins has area 1/(5+1) = 0.1667. This means that the normal scores for a dataset with n = 5 are -0.97, -0.43, 0.00, 0.43, and 0.97.
We can also see that the bins (-∞, -0.97], (-∞, -0.43], (-∞, 0.00], (-∞, 0.43], (-∞, 0.97] have areas 1/6 = 0.1667, 1/3 = 0.3333, 1/2 = 0.5000, 2/3 = 0.6667, 5/6 = 0.8333, respectively.
Q-Q Plots
A normal plot or Q-Q plot is formed by plotting the normal scores defined in the previous section are plotted on the y-axis vs. the actual sorted data values on the y-axis vs. .
If the normal plot is close to a straight line, we can conclude that the dataset is close to normal.
Here is a normal plot of the dataset
3 60 98 145 201
The dataset values on the y-axis are plotted against the normal scores
-0.97 0.43 0.00 0.43 0.97.
The normal plot is approximately a straight line, so we conclude that the original dataset is close to normally distributed.
Q-Q Plots with SPSS
Example: Obtain the normal plot of the NBS-10 data.
Select Analyze >> Descriptive Statistics >> Q-Q Plots. Move Difference to the Variables box, and select Van der Vaerden as the Proportion Estimation Formula.
Nonnormality
What if the dataset is not normal?
Here are the normal plots of datasets compare a normal dataset with other datasets tha deviate from normality in various ways.
In these normal plots, the actual data points are plotted on the x-axis and the expected normal scores (Van der Waerden's method) are plotted on the y-axis.
Data are normal. All the points of the normal plot fall roughly on the reference line.
Data are skewed to the left. The data are further away on the left and closer on the right than they would be if they were normal.
Data are skewed to the right. The data are closer on the left and further away on the right than they would be if they were normal.
The distribution of the data has thick tails. The data are further away on both the left and the right than they would be if they were normal.
The distribution of the data has thin tails. The data are closer on both the left and the right than they would be if they were normal.
Normal Plots IntroductionWe know that a bell-shaped histogram is said to have a normal distribution.However, in practice, it is often difficult to look at a histogram and determine how close its distribution is to normal.An easier way to tell if a dataset is normally distributed is to look at the normal plot. If the normal plot is close to a straight line, the distribution of the dataset is close to normal. Normal ScoresTo define normal scores using Van der Waerden's method, find z-scores that divide the standard normal curve into n+1 equal areas of 1/(n+1) each. For example, the normal scores when n = 5 are defined by the bins (-∞, -0.97], (-0.97, -0.43], (-0.43, 0.00], (0.00, 0.43], [0.43, 0.97], (0.97, ∞). Each of these bins has area 1/(5+1) = 0.1667. This means that the normal scores for a dataset with n = 5 are -0.97, -0.43, 0.00, 0.43, and 0.97.We can also see that the bins (-∞, -0.97], (-∞, -0.43], (-∞, 0.00], (-∞, 0.43], (-∞, 0.97] have areas 1/6 = 0.1667, 1/3 = 0.3333, 1/2 = 0.5000, 2/3 = 0.6667, 5/6 = 0.8333, respectively. Q-Q PlotsA normal plot or Q-Q plot is formed by plotting the normal scores defined in the previous section are plotted on the y-axis vs. the actual sorted data values on the y-axis vs. .If the normal plot is close to a straight line, we can conclude that the dataset is close to normal.Here is a normal plot of the dataset3 60 98 145 201The dataset values on the y-axis are plotted against the normal scores-0.97 0.43 0.00 0.43 0.97แผนปกติจะประมาณการแบบเส้นตรง ดังนั้นเราสรุปว่า ชุดข้อมูลเดิมปิดปกติ Q-Q ผืน ด้วยโปรแกรมตัวอย่าง: รับพล็อตปกติข้อมูลไซด์ 10เลือกวิเคราะห์ >> สถิติพรรณนา >> ผืน Q-Q ย้ายกล่องตัวแปรที่แตกต่าง และเลือก Van der Vaerden เป็นสูตรประเมินสัดส่วน Nonnormalityถ้าชุดข้อมูลไม่ปกติโครงการปกติเปรียบเทียบ datasets ชุดข้อมูลปกติ ด้วยท่าอื่น ๆ datasets พักตร์ normality ในรูปแบบต่าง ๆ ได้ในผืนเหล่านี้ปกติ จุดข้อมูลจริงถูกลงจุดบนแกน x และคะแนนปกติคาด (ตู้วิธี der Waerden) ถูกลงจุดบนแกน yข้อมูลปกติได้ คะแนนทั้งหมดแผนปกติอยู่ประมาณบรรทัดอ้างอิงข้อมูลบิดเบือนไปทางซ้ายไป ข้อมูลเพิ่มเติมจะเก็บทางด้านซ้าย และใกล้ชิดขวากว่าจะเป็นถ้าพวกเขาปกติข้อมูลบิดเบือนต้องไป ข้อมูลอยู่ใกล้ชิดทางด้านซ้าย และต่อไปด้านขวามากกว่าที่จะเป็นถ้าพวกเขาปกติการกระจายของข้อมูลมีหางหนา ข้อมูลได้เพิ่มเติมจากทางด้านซ้ายและด้านขวากว่าจะเป็นถ้าพวกเขาปกติการกระจายของข้อมูลมีหางบาง ข้อมูลอยู่ใกล้ชิดทางด้านซ้ายและด้านขวากว่าจะเป็นถ้าพวกเขาปกติ
การแปล กรุณารอสักครู่..
ปกติแปลงบทนำเรารู้ว่ากราฟรูประฆังจะกล่าวว่ามีการกระจายปกติ. แต่ในทางปฏิบัติก็มักจะเป็นเรื่องยากที่จะมองไปที่กราฟและกำหนดวิธีการปิดการกระจายของมันคือเป็นปกติ. เป็นวิธีที่ง่ายที่จะบอกได้ว่า ชุดข้อมูลที่มีการกระจายตามปกติคือดูที่พล็อตปกติ ถ้าพล็อตปกติอยู่ใกล้กับเส้นตรงการกระจายตัวของชุดข้อมูลที่มีความใกล้เคียงกับปกติ. คะแนนปกติเพื่อกำหนดคะแนนตามปกติโดยใช้วิธีการของ Van der Waerden หาคะแนน-Z ที่แบ่งมาตรฐานเส้นโค้งปกติใน 1 + n พื้นที่เท่ากัน 1 / (n + 1) ในแต่ละ ตัวอย่างเช่นคะแนนปกติเมื่อ n = 5 จะถูกกำหนดโดยถังขยะ (-∞, -0.97] (-0.97, -0.43] (-0.43, 0.00] (0.00, 0.43], [0.43, 0.97] (0.97, ∞). แต่ละถังขยะเหล่านี้พื้นที่ 1 / มี (5 + 1) = 0.1667. ซึ่งหมายความว่าคะแนนปกติสำหรับชุดข้อมูลที่มี n = 5 เป็น -0.97, -0.43, 0.00, 0.43 และ 0.97. เรา ยังสามารถดูที่ถังขยะ (-∞, -0.97] (-∞, -0.43] (-∞, 0.00] (-∞, 0.43] (-∞, 0.97] มีพื้นที่ 1/6 = 0.1667, 1/3 = 0.3333, 0.5000 = 1/2, 2/3 = 0.6667, 5/6 = 0.8333 ตามลำดับ. QQ พล็พล็อตปกติหรือพล็อตQQ จะเกิดขึ้นโดยการวางแผนคะแนนปกติที่กำหนดไว้ในส่วนก่อนหน้านี้ที่มีการวางแผนใน แกน y เทียบกับค่าของข้อมูลที่เกิดขึ้นจริงในการเรียงแกน y เทียบกับ. ถ้าพล็อตปกติอยู่ใกล้กับเส้นตรงที่เราสามารถสรุปได้ว่าเป็นชุดข้อมูลที่ใกล้เคียงกับปกติ. นี่เป็นพล็อตปกติของชุดข้อมูล3 60 98 145 201 ค่าชุดบนแกน y ที่มีการวางแผนกับคะแนนปกติ-0.97 0.43 0.00 0.43 0.97. พล็อตปกติจะอยู่ที่ประมาณเป็นเส้นตรงดังนั้นเราจึงสรุปได้ว่าชุดเดิมอยู่ใกล้กับกระจายตามปกติ. แปลง QQ ด้วยโปรแกรม SPSS ตัวอย่าง:. ได้รับการพล็อตปกติของข้อมูล NBS-10 เลือกวิเคราะห์สถิติเชิงพรรณนา >> >> แปลง QQ ย้ายแตกต่างไปตัวแปรกล่องและเลือกแวนเดอร์ Vaerden เป็นสูตรการประมาณค่าสัดส่วน. Nonnormality เกิดอะไรขึ้นถ้าชุดข้อมูลที่ไม่ได้เป็นปกติ? นี่คือแผนการปกติของชุดข้อมูลเปรียบเทียบชุดปกติกับชุดข้อมูลอื่น ๆ tha เบี่ยงเบนไปจากปกติในรูปแบบต่างๆ. ใน เหล่านี้แปลงปกติที่จุดข้อมูลที่แท้จริงมาลงจุดบนแกน x และคะแนนปกติที่คาดหวัง (วิธีของ Van der Waerden) จะจุดบนแกน y. ข้อมูลเป็นปกติ ทุกจุดของพล็อตปกติตกประมาณในบรรทัดอ้างอิง. ข้อมูลมีความเบ้ไปทางซ้าย ข้อมูลที่อยู่ไกลออกไปทางด้านซ้ายและด้านขวาใกล้ชิดกว่าที่พวกเขาจะเป็นว่าพวกเขาเป็นปกติ. ข้อมูลมีความเบ้ไปทางขวา ข้อมูลที่มีความใกล้ชิดทางด้านซ้ายและไกลออกไปทางด้านขวากว่าที่พวกเขาจะเป็นว่าพวกเขาเป็นปกติ. การกระจายของข้อมูลที่มีหางหนา ข้อมูลที่อยู่ไกลออกไปทั้งซ้ายและขวากว่าที่พวกเขาจะเป็นว่าพวกเขาเป็นปกติ. การกระจายของข้อมูลที่มีหางบาง ข้อมูลที่มีความใกล้ชิดทั้งด้านซ้ายและขวากว่าที่พวกเขาจะเป็นว่าพวกเขาเป็นปกติ
การแปล กรุณารอสักครู่..
ปกติแปลง
บทนำ
เรารู้ว่ากราฟรูประฆัง กล่าวกันว่ามีการแจกแจงแบบปกติ .
แต่ในทางปฏิบัติ มันมักจะเป็นเรื่องยากที่จะมองไปที่การกระจายของกราฟและหาวิธีปิดปกติ
วิธีง่ายที่จะบอกได้ว่าชุดข้อมูลมีการแจกแจงปกติ เพื่อดู พล็อตธรรมดา ถ้าเนื้อเรื่องปกติเกือบจะเป็นเส้นตรงการกระจายของข้อมูลใกล้เคียงกับปกติ
ปกติคะแนน
กำหนดปกติการอ่าน ฟาน เดอร์ waerden วิธีหา z-scores ที่แบ่งเส้นโค้งปกติมาตรฐานในพื้นที่ N 1 เท่ากับ 1 / ( 1 ) แต่ละ ตัวอย่างเช่น ปกติคะแนนเมื่อ n = 5 เป็น กําหนดโดย ถังขยะ ( - ∞ , - 0.97 ] ( - 0.97 , - 0.43 ] ( -0.43 , 0.00 0.00 ] ( 0.43 0.43 0.97 ] , [ , ] ( 0.97 ∞ )แต่ละช่องเหล่านี้มีพื้นที่ 1 / 5 ( 1 ) = 0.1667 . นี่หมายความว่า คะแนนปกติสำหรับชุดข้อมูลด้วย n = 5 - 0.97 -0.43 , 0.00 , 0.43 และ 0.97 .
เรายังสามารถดูว่าถังขยะ ( - ∞ , - 0.97 ] ( - ∞ , - 0.43 ] ( - ∞ , 0.00 ] ( - ∞ 0.43 ( ] - ∞ , 0.97 ] มีพื้นที่ 1 / 6 = 0.1667 1 / 3 = = 0.5000 0.3333 , 1 / 2 , 2 / 3 = 0.6667 5 / 6 = 0.8333 ตามลำดับ .
ครั้งแรกแปลงปกติหรือแปลงแปลงรูปแบบโดยครั้งแรกจะปกติคะแนนที่กำหนดไว้ในส่วนก่อนหน้าเป็นจุดบนแกน Y และจริงเรียงข้อมูลค่าในแกน Y vs .
ถ้าพล็อตธรรมดาเกือบจะเป็นเส้นตรง เราสามารถสรุปได้ว่า ข้อมูลใกล้เคียงกับปกติ
นี่คือพล็อตธรรมดาข้อมูล 60 98 145 201
3ข้อมูลค่าในแกน Y จะงัดข้อกับปกติ 0.00 0.43 0.43 คะแนน
- 0.97 0.97
เนื้อเรื่องปกติคือประมาณเป็นเส้นตรง ดังนั้นเราจึงสรุปได้ว่าชุดข้อมูลเดิมอยู่ใกล้กระจายปกติ
ครั้งแรกแปลงด้วย SPSS
ตัวอย่าง : ขอรับแผนปกติของข้อมูล nbs-10 .
เลือกวิเคราะห์สถิติเชิงพรรณนาครั้งแรก > > > > แปลง ย้ายที่แตกต่างไปจากตัวกล่องและเลือก ฟาน เดอร์ vaerden เป็นสัดส่วนประมาณสูตร nonnormality
ถ้าข้อมูลไม่ได้เป็นปกติ
นี่คือแปลงปกติของข้อมูลเปรียบเทียบข้อมูลกับข้อมูลอื่น ๆที่เบี่ยงเบนไปจากปกติ ปกติในรูปแบบต่างๆ .
ในแปลงปกติเหล่านี้
การแปล กรุณารอสักครู่..