Central Limit Theorem
The central limit theorem is one of the most significant conclusions of statistics.
The central limit theorem gives us opportunity to use the normal distribution theory in order to create confidence interval of the population mean.
With a confidence interval we can with a certain assurance determine the population mean.
According to the central limit theorem, for a large sample size, the sampling distribution of the sample mean is approximately normal, irrespective of the shape of the population distribution. The sample size is usually considered to be large if the sample size is over 30.
Note that when the population does not have a normal distribution, the shape of the sampling distribution is not exactly normal but approximately normal for a large sample size. The approximation becomes more accurate as the sample size increases.
Thus, if the sample size is 30 or more, the sample mean can be regarded to follow a normal distribution irrespective of the shape of the population. This is a result of a very practical importance.
Confidence interval
A confidence interval is an interval of values made by a sample where the population parameter belongs with a certain probability. The probability is called the confidence level. A confidence interval is made by the standardized normal distribution, using the central limit theorem.
Example. A 95% confidence interval means an interval where the population parameter will be found with 95% certainty, we have 95% confidence that the interval contains the true population parameter.
Formulas for confidence interval for large samples:
Confidence interval for the population mean µ :
where x ̅ = sample mean
n = sample size ( > 30)
s = standard deviation of the sample
z = value of the confidence level
Confidence interval for population proportion p:
where = sample proportion
n = sample size
z = value of the confidence level
Confidence level 95% 99% 99,9%
Value 1,96 2,58 3,30
The width of the confidence interval is the difference between the upper limit and the lower limit of the interval. The width is determined by
1. The confidence level, or the value of z
2. The sample size, n
If you increase the confidence level, the width of the interval increases. The higher probability for the population parameter to belong to the interval leads to a wider interval. The result will be less information about the population parameter. Instead you can decrease the width of the interval by taking a larger sample. A quadrupling of the sample size will lead to a divide into half of the interval.
Thus, if you want to decrease the width of a confidence interval, you have two choices:
1. Lower the confidence level
2. Increase the sample size
However, lowering the confidence level is not a good choice because a lower confidence level may give less reliable results. Therefore, you should always prefer to increase the sample size if you want to decrease the width of a confidence interval.
Sampling error
The difference between the value of a sample statistic obtained from a sample and the value of a corresponding population parameter obtained from the population is called the sampling error.
(Note that this difference represents the sampling error only if the sample is random and no nonsampling error has been made. Otherwise only a part of this difference will be due to the sampling error.)
The errors that occur in the collection, recording and tabulation of data, errors occur because of human mistakes, are called nonsampling errors.
Maximum error of estimate , the margin error e
For the population mean µ :
For the population proportion p:
เซ็นทรัลจำกัดทฤษฎีบทลิมิตกลาง
ทฤษฎีบทเป็นหนึ่งในข้อสรุปที่สำคัญที่สุดของสถิติ ทฤษฎีบทลิมิตกลาง
จะช่วยให้เรามีโอกาสที่จะใช้ทฤษฎีการแจกแจงปกติ เพื่อสร้างช่วงความเชื่อมั่นของค่าเฉลี่ยประชากร .
กับความเชื่อมั่นที่เราสามารถกับบางประกันตรวจสอบประชากรหมายถึง
ตามทฤษฎีขีดจำกัดกลางสำหรับขนาดตัวอย่างใหญ่ กลุ่มตัวอย่าง กลุ่มตัวอย่าง หมายถึง การประมาณปกติ โดยไม่คำนึงถึงรูปร่างของประชากรการกระจาย ขนาดตัวอย่างมีการพิจารณามักจะเป็นขนาดใหญ่ถ้าขนาดตัวอย่าง 30 .
หมายเหตุ เมื่อประชากรมีการแจกแจงแบบปกติรูปร่างของตัวอย่างการประมาณปกติ ไม่ปกติแน่นอน แต่สำหรับขนาดตัวอย่างใหญ่ การประมาณจะถูกต้องมากขึ้นเมื่อขนาดตัวอย่างเพิ่มขึ้น .
ดังนั้นถ้าขนาดตัวอย่าง 30 หรือมากกว่า ตัวอย่างว่า สามารถถือว่าทำตามปกติโดยไม่คำนึงถึงรูปร่างของประชากร นี้คือผลของความ
ในทางปฏิบัติมากความเชื่อมั่น : ความเชื่อมั่นเป็นช่วงของค่าโดยตัวอย่างที่ประชากรพารามิเตอร์เป็นของความน่าจะเป็นที่แน่นอน ความน่าจะเป็นเรียกว่าระดับความมั่นใจ มีความเชื่อมั่นที่สร้างขึ้นจากการแจกแจงปกติมาตรฐาน โดยใช้ทฤษฎีขีดจำกัดกลาง .
ตัวอย่างความเชื่อมั่น 95% หมายถึงช่วงเวลาที่ประชากรพารามิเตอร์จะพบ 95% แน่นอน เรามีความเชื่อมั่น 95% ว่า ช่วงเวลาที่มีค่าจริง
สูตรสำหรับช่วงความเชื่อมั่นสำหรับตัวอย่างขนาดใหญ่ :
ช่วงความเชื่อมั่นสำหรับประชากรหมายถึงµ :
เมื่อ x = ค่าเฉลี่ยตัวอย่าง̅
n = ขนาด ตัวอย่าง ( 30 )
s
= ค่าเบี่ยงเบนมาตรฐานของตัวอย่างZ = ค่าของระดับความเชื่อมั่น
ช่วงความเชื่อมั่นสำหรับสัดส่วนประชากร p :
n = = ตัวอย่างที่สัดส่วนขนาดตัวอย่าง
Z = ค่าของระดับความเชื่อมั่นที่ระดับความเชื่อมั่น 95 %
%
% 99,9 99 มูลค่า 1 , 96 2,58 3,30
ขนาดความกว้างของช่วงความเชื่อมั่นคือความแตกต่าง ระหว่างส่วนบนและล่างขีด จำกัด ขีด จำกัด ของช่วง ความกว้างจะถูกกำหนดโดย
1 ระดับความมั่นใจหรือค่า z
2 ขนาดตัวอย่าง n
ถ้าคุณเพิ่มระดับความมั่นใจ ความกว้างของช่วงที่เพิ่มขึ้น สูงกว่าค่าความน่าจะเป็นสำหรับประชากรเป็นของช่วงเวลา ไปสู่ช่วงที่กว้างขึ้น ผลที่ได้จะเป็นข้อมูลน้อยเกี่ยวกับประชากรพารามิเตอร์ แต่คุณสามารถลดความกว้างของช่วงโดยการเก็บตัวอย่างขนาดใหญ่เป็น quadrupling ของขนาดตัวอย่างจะนำไปสู่การแบ่งครึ่งของช่วง
ดังนั้นหากคุณต้องการลดความกว้างของช่วงความเชื่อมั่น คุณมีสองตัวเลือก :
1 ลดระดับความมั่นใจ
2 เพิ่มขนาดตัวอย่าง
แต่ลดระดับความเชื่อมั่นไม่ใช่ทางเลือกที่ดี เพราะระดับความเชื่อมั่นต่ำอาจจะให้ผลลัพธ์ที่เชื่อถือได้น้อยกว่า ดังนั้นคุณควรเลือกที่จะเพิ่มขนาดตัวอย่างถ้าคุณต้องการลดความกว้างของช่วงความเชื่อมั่น .
ผิดพลาด
ความแตกต่างระหว่างค่าของตัวอย่างสถิติที่ได้จากตัวอย่างและค่าพารามิเตอร์ของประชากรที่ได้จากประชากรเรียกว่า
ข้อผิดพลาดการสุ่มตัวอย่างการสุ่มตัวอย่าง( หมายเหตุว่า ความแตกต่างนี้เป็นข้อผิดพลาดการสุ่มตัวอย่าง ถ้าตัวอย่างที่สุ่มและไม่ nonsampling ข้อผิดพลาดได้ . มิฉะนั้นเพียงส่วนหนึ่งของความแตกต่างนี้จะเกิดจากข้อผิดพลาดการสุ่มตัวอย่าง )
ข้อผิดพลาดที่เกิดขึ้นในการเก็บรวบรวม , บันทึกและจัดระเบียบข้อมูล ข้อผิดพลาดเกิดขึ้นเพราะความผิดพลาดของมนุษย์ เรียกว่า nonsampling ข้อผิดพลาด .
ผิดพลาดสูงสุดของประมาณการกำไรข้อผิดพลาด E
,สำหรับประชากรหมายถึงµ :
สำหรับสัดส่วนประชากร p :
การแปล กรุณารอสักครู่..
