The question is often asked: "what's a good value for R-squared?" Sometimes the
claim is even made: "a model is not useful unless its R-squared is at least x", where x
may be some fraction greater than 50%. By this standard, the model we fitted to the
differenced, deflated, and seasonally adjusted auto sales series is disappointing: its Rsquared
is less than 25%. So what IS a good value for R-squared? The correct answer
to this question is polite laughter followed by: "That depends!"
The term R-squared refers to the fraction of variance explained by a model, but--what
is the relevant variance that demands explanation? We have seen by now that there
are many transformations that may be applied to a variable before it is used as a
dependent variable in a regression model: deflation, logging, seasonal adjustment,
differencing. All of these transformations will change the variance and may also
change the units in which variance is measured. Deflation and logging may
dramatically change the units of measurement, while seasonal adjustment and
differencing generally reduce the variance significantly when properly applied.
Therefore, if the dependent variable in the regression model has already been
transformed in some way, it is possible that much of the variance has already been
"explained" merely by the choice of an appropriate transformation. Seasonal
adjustment obviously tries to explain the seasonal component of the original variance,
while differencing tries to explain changes in the local mean of the series over time.
With respect to which variance should R-squared be measured--that of the original
series, the deflated series, the seasonally adjusted series, and/or the differenced series?
This question does not always have a clear-cut answer, and as we will see below,
there are usually several reference points that may be of interest in any particular case
คำถามที่มักจะถูกถาม : " อะไรคือค่าที่ดีสำหรับ r-squared ? " บางครั้งเรียกร้อง ทำให้ " แบบไม่ได้ประโยชน์เว้นแต่ r-squared อย่างน้อย X " ที่จ.อาจจะมีสัดส่วนมากกว่า 50% โดยมาตรฐานนี้ โมเดลที่เราติดตั้งเพื่อdifferenced กิ่ว , และ , ปรับปรุง seasonally ขายอัตโนมัติชุดผิดหวัง rsquared : ของน้อยกว่า 25% ดังนั้นสิ่งที่เป็นค่าที่ดีสำหรับ r-squared ? คำตอบที่ถูกต้องคำถามนี้เป็นคนสุภาพ เสียงหัวเราะตามด้วย " ที่ขึ้นอยู่กับ "คำ r-squared หมายถึงเศษเสี้ยวของความแปรปรวนอธิบายโดยโมเดล แต่ . . .คือความแปรปรวนที่เกี่ยวข้องต้องการคำอธิบาย ? เราได้เห็นแล้วว่ามีมีหลายแปลง ที่อาจจะใช้กับตัวแปรก่อนที่จะใช้เป็นขึ้นอยู่กับตัวแปรในแบบจำลองการถดถอย : ภาวะเงินฝืด , การเข้าสู่ระบบ , การปรับตามฤดูกาลวิ . ทั้งหมดของการเปลี่ยนแปลงเหล่านี้จะเปลี่ยนแปลงแปรปรวนและอาจยังเปลี่ยนหน่วยที่แปรปรวนคือวัด ภาวะเงินฝืดและเข้าสู่ระบบอาจสามารถเปลี่ยนหน่วยการวัด ในขณะที่การปรับตามฤดูกาลและปกติโดยทั่วไปลดความแปรปรวนอย่างมากเมื่อถูกใช้ดังนั้น ถ้าตัวแปรในตัวแบบการถดถอยได้เปลี่ยนในบางวิธี เป็นไปได้มากของความแปรปรวนได้" อธิบาย " แค่ โดยทางเลือกของการเปลี่ยนแปลงที่เหมาะสม ตามฤดูกาลการปรับชัดพยายามที่จะอธิบายส่วนประกอบความแปรปรวนของฤดูกาลเดิมในขณะที่ข้อมูลพยายามที่จะอธิบายการเปลี่ยนแปลงในท้องถิ่นหมายถึงชุดตลอดเวลาด้วยความเคารพในความ r-squared ซึ่งควรวัด . . ของเดิมชุด , กิ่วชุด , ชุดปรับฤดูกาลและ / หรือชุด differenced ?คำถามนี้ไม่เคยมีคำตอบที่ชัดเจน และเราจะเห็นด้านล่างมักจะมีการอ้างอิงหลายจุดที่อาจเป็นประโยชน์ในกรณีใด ๆโดยเฉพาะ
การแปล กรุณารอสักครู่..