3.1. Poisson regression model
In the Poisson regression model, the i-th observation of the dependent variable yi is modeled as a random Poisson variable with mean λi:
equation(1)
View the MathML source
Turn MathJax on
The most important property of the Poisson regression model is the equality of the mean and variance of the distribution, which is the main shortcoming of this model and blocks the “overdispersion” of accident data. In the Poisson model, the conditional variance is equal to the conditional mean:
equation(2)
View the MathML source
Turn MathJax on
The log-likelihood of the Poisson regression model is given by
equation(3)
View the MathML source
Turn MathJax on
To estimate the regression coefficients by the maximum likelihood method, the derivative of the log-likelihood relative to the vector of coefficients, β, is set equal to zero:
equation(4)
View the MathML source
Turn MathJax on
The estimation of the regression coefficients in the Poisson regression model is not obtained with a direct equation, but the Newton-Raphson iteration procedure is used for estimating the unknown parameters of the model. To perform the estimation process, the corresponding iteration algorithm is analyzed by SAS statistical software to obtain the calculated coefficients. The predicted value of ŷi is the conditional mean or average number of accidents given xi, which is also denoted as λi, that is, the mean of the random variable yi, which follows a Poisson distribution. This value is typically not an integer number, whereas the observed value yi is a count (Anselin, 2002).
3.2. Negative binomial regression model
In the negative binomial (NB) model yi, the i-th observation of the dependent variable has the following probability distribution function:
equation(5)
View the MathML source
Turn MathJax on
The conditional mean of yi, for the vector of observed independent variables, xi, is given by
equation(6)
View the MathML source
Turn MathJax on
The NB distribution does not have the disadvantage of the Poisson distribution because there is no equality of the mean and variance of the distribution. The relationship between the mean and variance of an NB distribution is
equation(7)
View the MathML source
Turn MathJax on
The variance of the NB distribution is always greater than the mean. Thus, it fits the data with a variance greater than the mean. α = 1/r is the dispersion parameter. For accident data with low dispersion, the Poisson distribution gives plausible results, but, if overdispersion exists in the data, the variance of data will be greater than the mean. In such cases, the NB distribution is preferred. In the NB regression model, the dispersion parameter should be estimated in addition to regression parameters. r must be positive, so r* = lnr is estimated instead, which can take on any value. The log-likelihood function of the NB model for the i-th observation is obtained from the following equation:
equation(8)
View the MathML source
Turn MathJax on
To estimate β and r*, as in the Poisson model, the iteration procedure of Newton-Raphson is applied ( Agresti, 2002). The related iteration algorithm is written in SAS to obtain the unknown parameters. In the NB regression model, the predicted value of ŷi is the conditional mean or average number of accidents given xi. This is also denoted as μi, that is, the mean of the random variable yi, which follows the NB distribution.
3.1 . รูปแบบถดถอยปัวซอในแบบจำลองการถดถอยปัวซง , i-th การสังเกตของยีตัวแปรแบบตัวแปรสุ่มปัวซงกับหมายถึงλฉัน :สมการ ( 1 )ดู MathML แหล่งเปิด mathjax บนคุณสมบัติที่สำคัญที่สุดของปัวซงสมการถดถอยแบบจำลองคือความเสมอภาคของค่าเฉลี่ยและความแปรปรวนของการกระจาย ซึ่งเป็นจุดอ่อนหลักของรุ่นนี้และบล็อก " overdispersion " ของข้อมูลอุบัติเหตุ ในพารามิเตอร์โมเดล แปรปรวนเงื่อนไขเท่ากับค่าเฉลี่ย เงื่อนไข :สมการ ( 2 )ดู MathML แหล่งเปิด mathjax บนบันทึกความน่าจะเป็นของการถดถอยปัวชงแบบที่จะได้รับโดยสมการ ( 3 )ดู MathML แหล่งเปิด mathjax บนการประเมินสัมประสิทธิ์ถดถอยโดยวิธีความควรจะเป็นสูงสุด จาก บันทึกโอกาสเมื่อเทียบกับเวกเตอร์ของสัมประสิทธิ์บีตาเป็นชุดเท่ากับศูนย์ :สมการ ( 1 )ดู MathML แหล่งเปิด mathjax บนการประมาณค่าของสัมประสิทธิ์ถดถอยในแบบจำลองการถดถอยปัวซอได้มาด้วยสมการโดยตรง แต่นิวตันราฟสันทำซ้ำขั้นตอนที่ใช้สำหรับประมาณค่าพารามิเตอร์ที่ไม่รู้จักของแบบจำลอง แสดงขั้นตอนการทำซ้ำที่สอดคล้องกันขั้นตอนวิธีวิเคราะห์โดยสถิติซอฟต์แวร์ SAS ได้รับการคำนวณค่าสัมประสิทธิ์ การทำนายค่าŷผมคือหมายถึงเงื่อนไขหรือจำนวนการเกิดอุบัติเหตุให้ ซี ซึ่งจะแสดงเป็นλผม นั่นคือ ค่าเฉลี่ยของตัวแปรสุ่ม อี , ข้อมูลการแจกแจงปัวซง . มูลค่านี้มักจะไม่ได้เป็นเลขจำนวนเต็ม และสังเกตค่าอีคือการนับ ( anselin , 2002 )3.2 . การวิเคราะห์การถดถอยทวินามลบในทางลบแบบทวินาม ( NB ) รุ่นอี , i-th การสังเกตของตัวแปรฟังก์ชันการแจกแจงความน่าจะเป็นดังนี้สมการ ( 5 )ดู MathML แหล่งเปิด mathjax บนหมายถึงเงื่อนไขของยี เพื่อสังเกตเวกเตอร์ของตัวแปรอิสระ , Xi , จะได้รับโดยสมการที่ ( 6 )ดู MathML แหล่งเปิด mathjax บนส่วน NB กระจายไม่มีข้อเสียของการแจกแจงปัวซงเพราะไม่มีความเสมอภาคของค่าเฉลี่ยและความแปรปรวนของการแจกแจง ความสัมพันธ์ระหว่างค่าเฉลี่ยและความแปรปรวนของ NB กระจายสมการที่ ( 7 )ดู MathML แหล่งเปิด mathjax บนความแปรปรวนของ NB กระจายเสมอมากกว่าค่าเฉลี่ย ดังนั้น จึงเหมาะกับข้อมูลที่มีความแปรปรวนมากขึ้นกว่าค่าเฉลี่ย α = 1 / R คือการแพร่กระจายของพารามิเตอร์ สำหรับข้อมูลอุบัติเหตุ ด้วยการกระจายต่ำ การแจกแจงปัวซงให้ผลที่น่าเชื่อถือ แต่ถ้า overdispersion ที่มีอยู่ในข้อมูล ความแปรปรวนของข้อมูลจะมากกว่าค่าเฉลี่ย ในบางกรณี , NB แบบที่ต้องการ ใน NB ตัวแบบการถดถอย , การประมาณพารามิเตอร์ควรนอกจากพารามิเตอร์การถดถอย R ต้องเป็นบวก ดังนั้น R * = ในปริมาณประมาณแทน ซึ่งสามารถใช้ค่าใด ๆ บันทึกโอกาสการทำงานของรุ่น NB สำหรับ i-th สังเกตได้จากสมการดังต่อไปนี้สมการ ( 8 )ดู MathML แหล่งเปิด mathjax บนประมาณการบีตาและ R * ในพารามิเตอร์โมเดล ทำซ้ำขั้นตอนของนิวตันราฟสันที่ใช้ ( agresti , 2002 ) ที่เกี่ยวข้องกับการวิธีการเขียนใน SAS เพื่อให้ได้ค่าพารามิเตอร์ที่ไม่รู้จัก ใน NB ตัวแบบการถดถอย , คาดการณ์มูลค่าของŷผมคือหมายถึงเงื่อนไขหรือจำนวนการเกิดอุบัติเหตุให้ Xi นี้จะแสดงเป็นμผม นั่นคือ ค่าเฉลี่ยของตัวแปรสุ่มยีซึ่งตามนบี การกระจายสินค้า
การแปล กรุณารอสักครู่..
