Linear least squares regression is by far the most widely used modeling method. It is what most people mean when they say they have used "regression", "linear regression" or "least squares" to fit a model to their data. Not only is linear least squares regression the most widely used modeling method, but it has been adapted to a broad range of situations that are outside its direct scope. It plays a strong underlying role in many other modeling methods, including the other methods discussed in this section: nonlinear least squares regression, weighted least squares regression and LOESS.
Definition of a Linear Least Squares Model Used directly, with an appropriate data set, linear least squares regression can be used to fit the data with any function of the form
f(x→;β→)=β0+β1x1+β2x2+…
in which
each explanatory variable in the function is multiplied by an unknown parameter,
there is at most one unknown parameter with no corresponding explanatory variable, and
all of the individual terms are summed to produce the final function value.
In statistical terms, any function that meets these criteria would be called a "linear function". The term "linear" is used, even though the function may not be a straight line, because if the unknown parameters are considered to be variables and the explanatory variables are considered to be known coefficients corresponding to those "variables", then the problem becomes a system (usually overdetermined) of linear equations that can be solved for the values of the unknown parameters. To differentiate the various meanings of the word "linear", the linear models being discussed here are often said to be "linear in the parameters" or "statistically linear".
Why "Least Squares"? Linear least squares regression also gets its name from the way the estimates of the unknown parameters are computed. The "method of least squares" that is used to obtain parameter estimates was independently developed in the late 1700's and the early 1800's by the mathematicians Karl Friedrich Gauss, Adrien Marie Legendre and (possibly) Robert Adrain [Stigler (1978)] [Harter (1983)] [Stigler (1986)] working in Germany, France and America, respectively. In the least squares method the unknown parameters are estimated by minimizing the sum of the squared deviations between the data and the model. The minimization process reduces the overdetermined system of equations formed by the data to a sensible system of p, (where p is the number of parameters in the functional part of the model) equations in p unknowns. This new system of equations is then solved to obtain the parameter estimates. To learn more about how the method of least squares is used to estimate the parameters, see Section 4.4.3.1.
Examples of Linear Functions As just mentioned above, linear models are not limited to being straight lines or planes, but include a fairly wide range of shapes. For example, a simple quadratic curve,
f(x;β→)=β0+β1x+β11x2,
is linear in the statistical sense. A straight-line model in log(x),
f(x;β→)=β0+β1ln(x),
or a polynomial in sin(x),
f(x;β→)=β0+β1sin(x)+β2sin(2x)+β3sin(3x),
is also linear in the statistical sense because they are linear in the parameters, though not with respect to the observed explanatory variable, x.
Nonlinear Model Example Just as models that are linear in the statistical sense do not have to be linear with respect to the explanatory variables, nonlinear models can be linear with respect to the explanatory variables, but not with respect to the parameters. For example,
f(x;β→)=β0+β0β1x
is linear in x, but it cannot be written in the general form of a linear model presented above. This is because the slope of this line is expressed as the product of two parameters. As a result, nonlinear least squares regression could be used to fit this model, but linear least squares cannot be used. For further examples and discussion of nonlinear models see the next section, Section 4.1.4.2.
Advantages of Linear Least Squares Linear least squares regression has earned its place as the primary tool for process modeling because of its effectiveness and completeness.
Though there are types of data that are better described by functions that are nonlinear in the parameters, many processes in science and engineering are well-described by linear models. This is because either the processes are inherently linear or because, over short ranges, any process can be well-approximated by a linear model.
The estimates of the unknown parameters obtained from linear least squares regression are the optimal estimates from a broad class of possible parameter estimates under the usual assumptions used for process modeling. Practically speaking, linear least squares regression makes very efficient use of the data. Good results can be obtained with relatively small data sets.
Finally, the theory associated with linear regression is well-understood and allows for construction of different types of easily-interpretable statistical intervals for predictions, calibrations, and optimizations. These statistical intervals can then be used to give clear answers to scientific and engineering questions.
Disadvantages of Linear Least Squares The main disadvantages of linear least squares are limitations in the shapes that linear models can assume over long ranges, possibly poor extrapolation properties, and sensitivity to outliers.
Linear models with nonlinear terms in the predictor variables curve relatively slowly, so for inherently nonlinear processes it becomes increasingly difficult to find a linear model that fits the data well as the range of the data increases. As the explanatory variables become extreme, the output of the linear model will also always more extreme. This means that linear models may not be effective for extrapolating the results of a process for which data cannot be collected in the region of interest. Of course extrapolation is potentially dangerous regardless of the model type.
Finally, while the method of least squares often gives optimal estimates of the unknown parameters, it is very sensitive to the presence of unusual data points in the data used to fit a model. One or two outliers can sometimes seriously skew the results of a least squares analysis. This makes model validation, especially with respect to outliers, critical to obtaining sound answers to the questions motivating the construction of the model.
สหสัมพันธ์เชิงเส้นตามแนวยาวอย่างน้อยจตุรัสมีอยู่ไม่ไกลจากวิธีการสร้างแบบจำลองที่ใช้อย่างกว้างขวางมากที่สุด มันเป็นสิ่งที่ผู้คนหมายความว่าอย่างไรเมื่อเขาบอกว่าเขาได้ถูกนำมาใช้"( Log ","ตามแนวยาว( Log "หรือ"อย่างน้อยจัตุรัส"เพื่อความกระชับที่รุ่นของข้อมูล. ไม่เพียงแห่งเดียวที่มี( Log จตุรัสอย่างน้อยการสร้างแบบจำลองแนวยาววิธีการใช้อย่างกว้างขวางมากที่สุดแต่มันได้รับการดัดแปลงเพื่อความหลากหลายของสถานการณ์ที่อยู่นอกขอบเขตของตนโดยตรงสามารถเล่นได้อย่างแข็งแกร่งพื้นฐานมีบทบาทในการสร้างแบบจำลองวิธีการอื่นๆจำนวนมากซึ่งรวมถึงวิธีการอื่นๆที่กล่าวถึงในส่วนนี้: nonlinear อย่างน้อยจตุรัส( Log ,ถ่วงน้ำหนักอย่างน้อยจตุรัส( Log และ Loess Plateau บ้านพักพื้นเมือง.
คำนิยามของที่ตามแนวยาวอย่างน้อยจตุรัสรุ่นใช้งานโดยตรงด้วยข้อมูลที่เหมาะสมตั้งค่า,ตามแนวยาวอย่างน้อยจตุรัส( Log สามารถใช้ให้เหมาะสมกับข้อมูลที่มีการใช้งานในรูปแบบ
F ( x→ ;β→)=เฉพาะ 0 เฉพาะ 1 x 1 เฉพาะ 2 x 2 ...................
ซึ่งจะช่วยในการอธิบายได้ตามต้องการในแต่ละครั้งที่ใช้งานได้เพิ่มขึ้นอีกโดยที่ไม่รู้จักพารามิเตอร์,
มีที่มากที่สุดคนหนึ่งที่ไม่รู้จักพารามิเตอร์ที่เกี่ยวข้องพร้อมด้วยไม่มีการอธิบายแบบปรับได้หลายระดับและ
ทั้งหมดของแต่ละเงื่อนไขได้สรุปในการผลิตที่ใช้งานครั้งสุดท้ายมูลค่า.
ในเชิงสถิติข้อกำหนดใดๆที่ฟังก์ชันที่ตรงตามเงื่อนไขเหล่านี้จะได้รับการเรียกว่า"ตามแนวยาวทำงาน".คำว่า"ตามแนวยาว"คือใช้ได้แม้จะทำงานที่อาจไม่ได้รับสายโดยตรงเพราะหากพารามิเตอร์ที่ไม่รู้จักที่จะได้รับการพิจารณาให้เป็นตัวแปรต่างๆและตัวแปรการอธิบายที่ได้รับการพิจารณาให้เป็นเป็นที่รู้จักกันในชื่อ coefficients ที่เกี่ยวข้องกับ"เป็นตัวแปรสำคัญที่"แล้วยังมีปัญหาที่จะกลายเป็นระบบ(โดยปกติแล้ว overdetermined )ของสมตามแนวยาวที่สามารถแก้ไขได้สำหรับค่าพารามิเตอร์ที่ไม่รู้จักในการสร้างความแตกต่างให้กับความหมายของคำว่า"ตามแนวยาว"รุ่นตามแนวยาวที่กำลังกล่าวถึงนี้กล่าวกันว่าจะเป็น"ตามแนวยาวในพารามิเตอร์ที่"หรือ"ตามแนวยาวทางสถิติ"..
ทำไม"จัตุรัสอย่างน้อยมาก" สหสัมพันธ์เชิงเส้นตามแนวยาวอย่างน้อยจตุรัสนอกจากนั้นยังจะมีชื่อเรียกจากทางได้ประมาณการไว้ที่ของพารามิเตอร์ที่ไม่รู้จักที่จะคำนวณ"วิธีการอย่างน้อยจัตุรัส"ที่จะใช้ในการขอรับค่าพารามิเตอร์ประเมินได้พัฒนาอย่างเป็นอิสระในช่วงปลายปี 1700 และช่วงต้นปี 1800 โดยนักคณิตศาสตร์ Karl Friedrich เกาซ, adrien Marie legendre และ(อาจจะ) Robert adrain [ stigler ( 1978 )][ harter ( 1983 )][ stigler ( 1986 )]กำลังทำงานในเยอรมนี,ฝรั่งเศสและอเมริกาเหนือ,ตามลำดับ.ในวิธีการอย่างน้อยที่จตุรัสพารามิเตอร์ที่ไม่รู้จักที่จะมีการประเมินโดยการลดจำนวนเงินที่บนสังเวียนของตัวแปรที่ระหว่างข้อมูลและรุ่น ที่การลดขั้นตอนที่ overdetermined ระบบของสมโดยที่ข้อมูลในระบบที่มีเหตุผลของ P ,(สถานที่ซึ่งเป็นที่ของพารามิเตอร์ที่เต็มไปด้วยประโยชน์ใช้สอยในส่วนของรุ่น)และใน P ' s Gravesite .ระบบใหม่นี้จะช่วยแก้ปัญหาของสมในการขอรับประเมินค่าพารามิเตอร์นี้แล้ว เมื่อต้องการศึกษาเพิ่มเติมเกี่ยวกับวิธีการใช้วิธีการของช่องอย่างน้อยจะใช้ในการประเมินค่าพารามิเตอร์ที่ดูที่ส่วน 4.4.3.1 .
ตัวอย่างของการทำงานตามแนวยาวเป็นเพียงกล่าวถึงข้างต้นรุ่นตามแนวยาวไม่จำกัด(มหาชน)เพื่อเป็นสายตรงหรือเครื่องบินแต่รวมถึงขนาดค่อนข้างหลากหลายของรูปร่าง ตัวอย่างเช่นความโค้งมนในพีชคณิตที่มีกำลังสองแบบเรียบง่ายที่
F ( xβ→)=เฉพาะ 0 เฉพาะ 1 x 11 x 2 เฉพาะ
เป็นเส้นตรงในความหมายทางสถิติที่ ตรง - สายการผลิตของรุ่นในล็อกอินเข้าสู่( X ),(~ F ( X ;β→)=เฉพาะ 0 เฉพาะ 1 ลักษณะคล้ายกัน( X ),
หรือ polynomial ในเครื่องบูชาไถ่บาป( X ),(~ F ( X ;β→)=เฉพาะ 0 เฉพาะ 1 เครื่องบูชาไถ่บาป( X )เฉพาะ 2 เครื่องบูชาไถ่บาป( 2 x )เฉพาะ 3 เครื่องบูชาไถ่บาป( 3 x ),
ยังเป็นแนวยาวในเชิงสถิติความรู้สึกเพราะพวกเขาเป็นเส้นตรงในพารามิเตอร์,แม้ไม่มีความเคารพในที่สังเกตการอธิบายได้, X .
nonlinear รุ่นตัวอย่างเช่นเพียงเป็นรุ่นที่ได้รับตามแนวยาวในความรู้สึกทางสถิติที่ไม่ต้องได้รับตามแนวยาวพร้อมด้วยความเคารพในตัวแปรการอธิบายให้รุ่น nonlinear สามารถตามแนวยาวพร้อมด้วยความเคารพในตัวแปรการอธิบายได้แต่ไม่ได้พร้อมด้วยความเคารพในพารามิเตอร์ที่. ตัวอย่างเช่น
not F ( x β→)=เฉพาะ 0 เฉพาะ 0 เฉพาะ 1 x
ซึ่งจะช่วยเป็นแนวยาวใน X แต่ไม่สามารถจะมีการบันทึกไว้ในรูปแบบทั่วไปของรุ่นตามแนวยาวที่แสดงข้างต้น.โรงแรมแห่งนี้เป็นเพราะความลาดชันของสายนี้คือการแสดง ผลิตภัณฑ์ ของสองพารามิเตอร์ เป็นผลมาจากจัตุรัสสหสัมพันธ์เชิงเส้นอย่างน้อย nonlinear สามารถใช้ให้เหมาะกับรุ่นนี้แต่จตุรัสตามแนวยาวอย่างน้อยไม่สามารถนำมาใช้ สำหรับการประชุมและตัวอย่างของ nonlinear รุ่นโปรดดูที่ส่วนถัดไปที่มาตรา 4.1.4.2 .
ข้อดีของตามแนวยาวอย่างน้อยจตุรัสตามแนวยาวอย่างน้อยจตุรัส( Log ได้รับของพื้นที่สถานที่ที่เป็นเครื่องมือหลักสำหรับขั้นตอนการสร้างแบบจำลองเพราะของที่มี ประสิทธิภาพ และความสมบูรณ์.
แม้ว่าจะยังมี ประเภท ของข้อมูลที่ดีตามที่อธิบายไว้ในการทำงานที่มี nonlinear ในที่พารามิเตอร์,จำนวนมากขั้นตอนในด้านวิศวกรรมและวิทยาศาสตร์มีการจัดให้บริการเป็นอย่างดี - อธิบายได้ตามแนวยาวรุ่น.โรงแรมแห่งนี้เป็นเพราะทั้งที่กระบวนการก่อความเสียหายโดยตรงเป็นแบบ linear หรือเพราะ,ในระยะสั้นช่วง,กระบวนการสามารถเป็นอย่างดีโดยที่ตามแนวยาวโดยรุ่น.
ได้ประมาณการไว้ในที่ที่ไม่รู้จักพารามิเตอร์ได้รับจากตามแนวยาวอย่างน้อยจตุรัส( Log จะได้ผลดีที่สุดมีการประเมินโดยจากที่กว้าง class ของพารามิเตอร์ที่เป็นไปได้ตามที่มีการประเมินโดยตามปกติข้อสมมติที่ใช้สำหรับขั้นตอนการสร้างแบบจำลอง. สื่อสารด้วยพื้นที่ใช้งานจริง( Log จตุรัสอย่างน้อยตามแนวยาวทำให้ใช้งานอย่างมี ประสิทธิภาพ ของข้อมูล ผลลัพธ์ที่ดีสามารถรับได้กับชุดข้อมูลขนาดเล็ก.
สุดท้ายทฤษฎีที่เกี่ยวข้องกับสหสัมพันธ์เชิงเส้นแนวยาวมีที่ตั้งที่ดี - ทำความเข้าใจและช่วยให้การก่อสร้างใน ประเภท ที่แตกต่างกันในแต่ละช่วงของข้อมูลทางสถิติได้อย่างง่ายดาย - interpretable สำหรับ calibrations ทำนายและได้รับการปรับแต่งเหล่านี้ทางสถิติในแต่ละช่วงจึงสามารถใช้ในการทำให้ล้างคำตอบเป็นวิทยาศาสตร์และวิศวกรรมคำถาม.
ข้อเสียเปรียบของตามแนวยาวอย่างน้อยจัตุรัสหลักข้อเสียเปรียบของตามแนวยาวอย่างน้อยจตุรัสมีข้อจำกัดในด้านรูปทรงตามแนวยาวรุ่นที่สามารถจะต้องเป็นผู้รับผิดชอบในช่วงที่เป็นไปได้ว่าอาจเป็นผู้น่าสงสารกลั่นกรองคุณสมบัติและความไวในการ outliers .
รุ่นตามแนวยาวพร้อมด้วยข้อกำหนด nonlinear ในตัวแปรตัวทำนายความโค้งมนค่อนข้างช้าลงดังนั้นสำหรับกระบวนการ nonlinear หมายความว่ามันกลายเป็นเรื่องยุ่งยากมากยิ่งขึ้นในการค้นหารุ่นตามแนวยาวที่มีขนาดพอดีกับข้อมูลได้เป็นอย่างดีแต่ช่วงที่มีปริมาณเพิ่มขึ้นข้อมูล การอธิบายเป็นตัวแปรที่จะกลายเป็นสุดยอดเอาต์พุตของรุ่นตามแนวยาวที่จะมีมากกว่าทุกครั้ง Extremeซึ่งหมายความว่ารุ่นตามแนวยาวอาจจะไม่มีผลบังคับใช้สำหรับดังผลของการที่ไม่สามารถเก็บรวบรวมข้อมูลในพื้นที่ที่น่าสนใจ แน่นอนว่ากลั่นกรองเป็นอันตรายอาจทำให้เกิดความเสียหายโดยไม่คำนึงถึง ประเภท รุ่น.
สุดท้ายในขณะที่วิธีการของช่องอย่างน้อยมักจะให้ประเมิน ประสิทธิภาพ ของพารามิเตอร์ที่ไม่รู้จักเป็นอย่างมากที่สำคัญการมีอยู่ของจุดข้อมูลผิดปกติในข้อมูลที่ใช้ในการพอดีกับที่ หนึ่งหรือสอง outliers สามารถบางครั้งลาดผลการวิเคราะห์จตุรัสอย่างน้อยหนึ่งอย่างจริงจัง รุ่นนี้จะทำให้การตรวจสอบโดยเฉพาะ outliers ที่มีความสำคัญในการหาคำตอบเสียงไปที่คำถามที่สร้างแรงจูงใจการก่อสร้างของรุ่นที่
การแปล กรุณารอสักครู่..
![](//thimg.ilovetranslation.com/pic/loading_3.gif?v=b9814dd30c1d7c59_8619)