This study examines measures of pre

This study examines measures of predictive power for a generalized linear model (GLM). Although many measures of predictive power for GLMs have been proposed, most have limitations. Hence, we focus on the regression correlation coefficient (RCC) (Zheng and Agresti, 2000), which satisfies the four requirements of (i) interpretability, (ii) applicability, (iii) consistency, and (iv) affinity. The RCC is a population value that is defined by the correlation between a response variable and the conditional expectation of the response variable. Its sample value is defined by the sample correlation between the observed response values and estimated values of the response variable. For an arbitrary GLM, we do not always have an explicit form of the RCC. However, for a Poisson regression model, assuming that the predictor variables have a multivariate normal distribution, we can find the explicit form of the RCC (true value). Therefore, it is possible to compare the estimators (sample values) of the RCC in terms of bias and RMSE (root of the mean square error) by using the true value. Furthermore, by using the explicit form, we propose a new estimator of the RCC for the Poisson regression model. We then compare the new estimator with the sample correlation estimator, the jack-knife estimator, and the leave-one-out cross validation estimator in terms of bias and RMSE. The leave-one-out cross validation estimator has large negative bias and large RMSE. Although the remaining three estimators show similar behavior for a large sample size, for a small sample size the new estimator shows the best behavior in terms of bias and RMSE.

Keywords
Regression correlation coefficient; Measure of predictive power; Multiple correlation coefficient; Goodness of fit; Generalized linear model; Poisson regression model
Gadget timed out while loading
1. Introduction
Statistical models created from the given data must be evaluated by using a certain criterion in order to allow the best candidate model to be selected. In this study, we focus on measures of predictive power for a specific model, the generalized linear model (GLM) (Dobson and Barnett, 2008 and Nelder and Wedderburn, 1972). While many well-known measures of predictive power exist, such as the multiple correlation coefficient , coefficient of determination , and AIC, these have limitations in certain situations (we discuss the limitations of existing measures and requirements in detail later).

The measure of predictive power satisfying our requirements was proposed by Zheng and Agresti (2000), the so-called regression correlation coefficient (RCC). In addition, similar measures of predictive power, such as the entropy correlation coefficient (ECC) and entropy coefficient of determination (ECD), which rely on Kullback–Leibler information, were proposed by Eshima and Tabata (2007) and Eshima and Tabata (2010). The RCC is the most basic measure of predictive measure of the three since it was proposed initially, while the latter two measures of predictive power were based on the RCC. Hence, we focus on this basic measure of predictive power in this study. The RCC is a population value defined by the correlation between the response variable Y and conditional expectation . If the response variable Y has a strong correlation with the conditional expectation , then the RCC tends to 1 and we judge the model as good. On the contrary, if the RCC tends to 0, then we do not regard it as a good model. Indeed, the RCC lies between 0 and 1.

For an arbitrary GLM, the explicit form of the RCC is unknown. However, in the Poisson regression model, assuming that the predictor variables have a multivariate normal distribution, the explicit form of the RCC can be found. By using this explicit form, we propose a new estimator of the RCC and compare it with the sample correlation estimator, the jack-knife estimator, and the leave-one-out cross validation estimator in terms of bias and RMSE.

The remainder of the paper is organized as follows. In Section 2, we explain the Poisson regression model, while Section 3 introduces the existing measures of predictive power and their limitations. Then, we discuss the requirements in detail and confirm that the RCC satisfies them. Moreover, the explicit form of the RCC is shown. We conduct a simulation study to compare the estimators of the RCC in terms of bias and RMSE in Section 4. In Section 5, we apply the RCC to the Poisson regression model by using real data.

2. Poisson regression model
The GLM is written as

Turn MathJax on

where α is an intercept term, is a vector of coefficients, g(⋅) is a link function, and D(θ) is a distribution in the exponential family with a parameter θ. The Poisson regression model assumes a Poisson distribution P(θ) as the error structure and a logarithmic function as the link function. Then, the Poisson regression model is written as
equation(1)

Turn MathJax on

Since , then we have
equation(2)

Turn MathJax on

R

Keywords
Regression correlation coefficient; Measure of predictive power; Multiple correlation coefficient; Goodness of fit; Generalized linear model; Poisson regression model
Gadget timed out while loading
1. Introduction
Statistical models created from the given data must be evaluated by using a certain criterion in order to allow the best candidate model to be selected. In this study, we focus on measures of predictive power for a specific model, the generalized linear model (GLM) (Dobson and Barnett, 2008 and Nelder and Wedderburn, 1972). While many well-known measures of predictive power exist, such as the multiple correlation coefficient , coefficient of determination , and AIC, these have limitations in certain situations (we discuss the limitations of existing measures and requirements in detail later).

The measure of predictive power satisfying our requirements was proposed by Zheng and Agresti (2000), the so-called regression correlation coefficient (RCC). In addition, similar measures of predictive power, such as the entropy correlation coefficient (ECC) and entropy coefficient of determination (ECD), which rely on Kullback–Leibler information, were proposed by Eshima and Tabata (2007) and Eshima and Tabata (2010). The RCC is the most basic measure of predictive measure of the three since it was proposed initially, while the latter two measures of predictive power were based on the RCC. Hence, we focus on this basic measure of predictive power in this study. The RCC is a population value defined by the correlation between the response variable Y and conditional expectation . If the response variable Y has a strong correlation with the conditional expectation , then the RCC tends to 1 and we judge the model as good. On the contrary, if the RCC tends to 0, then we do not regard it as a good model. Indeed, the RCC lies between 0 and 1.

For an arbitrary GLM, the explicit form of the RCC is unknown. However, in the Poisson regression model, assuming that the predictor variables have a multivariate normal distribution, the explicit form of the RCC can be found. By using this explicit form, we propose a new estimator of the RCC and compare it with the sample correlation estimator, the jack-knife estimator, and the leave-one-out cross validation estimator in terms of bias and RMSE.

The remainder of the paper is organized as follows. In Section 2, we explain the Poisson regression model, while Section 3 introduces the existing measures of predictive power and their limitations. Then, we discuss the requirements in detail and confirm that the RCC satisfies them. Moreover, the explicit form of the RCC is shown. We conduct a simulation study to compare the estimators of the RCC in terms of bias and RMSE in Section 4. In Section 5, we apply the RCC to the Poisson regression model by using real data.

2. Poisson regression model
The GLM is written as

Turn MathJax on

where α is an intercept term, is a vector of coefficients, g(⋅) is a link function, and D(θ) is a distribution in the exponential family with a parameter θ. The Poisson regression model assumes a Poisson distribution P(θ) as the error structure and a logarithmic function as the link function. Then, the Poisson regression model is written as
equation(1)

Turn MathJax on

Since , then we have
equation(2)

Turn MathJax on

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

การศึกษานี้ตรวจสอบมาตรการพลังงานคาดการณ์สำหรับแบบจำลองเชิงเส้นทั่วไป (จีแอลเอ็มเมอริเดียน) แม้ว่าจะได้รับการเสนอมาตรการจำนวนมากของพลังงานคาดการณ์สำหรับ GLMs ส่วนใหญ่มีข้อจำกัด ด้วยเหตุนี้ เรามุ่งเน้นในการถดถอยสัมประสิทธิ์สหสัมพันธ์ (RCC) (เจิ้งและ Agresti, 2000), ซึ่งตอบสนองความต้องการสี่ interpretability (i), (ii) ความเกี่ยวข้อง, (iii) ความสอดคล้อง และ (iv) ของความสัมพันธ์ RCC เป็นค่าประชากรที่กำหนด โดยความสัมพันธ์ระหว่างตัวแปรการตอบสนองและความคาดหวังแบบมีเงื่อนไขของตัวแปรตอบสนอง มีกำหนดค่าของตัวอย่าง โดยตัวอย่างความสัมพันธ์ระหว่างค่าสังเกตการตอบสนองและประเมินค่าของตัวแปรตอบสนอง สำหรับโครงการ GLM ตัวเอง เราไม่เคยมีแบบที่ชัดเจนของ RCC อย่างไรก็ตาม สำหรับแบบจำลองการถดถอยของ Poisson สมมติว่าตัวแปรทำนายมีการกระจายปกติตัวแปรพหุ เราสามารถหาแบบฟอร์มชัดเจนของ RCC (ค่าจริง) จึง มันเป็นไปได้ที่จะเปรียบเทียบ estimators (ค่าตัวอย่าง) ของ RCC ในแง่อคติและ RMSE (รากของข้อผิดพลาดหมายถึงตาราง) โดยใช้มูลค่าแท้จริง นอกจากนี้ โดยใช้แบบฟอร์มที่ชัดเจน เรานำเสนอประมาณการใหม่ของ RCC ที่สำหรับแบบจำลองการถดถอยของ Poisson เราเปรียบเทียบประมาณการใหม่กับความสัมพันธ์ประมาณตัวอย่าง การประมาณ และประมาณลาหนึ่งออกตรวจสอบไขว้ในแง่อคติและ RMSE jack-knife ลาหนึ่งออกข้ามตรวจสอบประมาณมีอคติเชิงลบที่มีขนาดใหญ่และขนาดใหญ่ RMSE ถึงแม้ว่า estimators สามที่เหลือแสดงลักษณะการทำงานคล้ายกันสำหรับขนาดตัวอย่างขนาดใหญ่ สำหรับตัวอย่างขนาดเล็กขนาด ประมาณใหม่แสดงลักษณะการทำงานที่ดีที่สุดในแง่อคติและ RMSEคำสำคัญสัมประสิทธิ์การถดถอยสหสัมพันธ์ วัดพลังงานคาดการณ์ สัมประสิทธิ์สหสัมพันธ์หลาย ความดีของพอดี แบบจำลองเชิงเส้นทั่วไป แบบจำลองถดถอย Poissonหมดเวลาขณะกำลังโหลดโปรแกรมเบ็ดเตล็ด1. บทนำโมเดลที่สร้างขึ้นจากข้อมูลทางสถิติต้องมีประเมิน โดยใช้เกณฑ์บางอย่างเพื่อให้รุ่นผู้สมัครที่ดีที่สุดที่จะเลือก ในการศึกษานี้ เรามุ่งเน้นในมาตรการของระบบพลังงานแบบเจาะจง แบบจำลองเชิงเส้นทั่วไป (จีแอลเอ็มเมอริเดียน) (ด็อบสัน และบาร์ เน็ตต์ 2008 และ Nelder และ Wedderburn, 1972) ในขณะที่มีอยู่มากมายรู้จักมาตรการพลังงานคาดการณ์ เช่นสัมประสิทธิ์สหสัมพันธ์หลาย สัมประสิทธิ์ของการกำหนด และ AIC เหล่านี้มีข้อจำกัดในบางสถานการณ์ (เราอธิบายข้อจำกัดของมาตรการที่มีอยู่และความต้องการในรายละเอียดภายหลัง)การวัดระบบไฟฟ้าตามข้อกำหนดของเราถูกเสนอ โดยเจิ้งและ Agresti (2000), สัมประสิทธิ์สหสัมพันธ์การถดถอยที่เรียกว่า (RCC) นอกจากนี้ มาตรการคล้ายอำนาจทำนาย เช่น entropy สัมประสิทธิ์สหสัมพันธ์ (ECC) และสัมประสิทธิ์ของเอนโทรปีของความมุ่งมั่น (เบาะแส), ซึ่งพึ่งพาข้อมูล Kullback – Leibler ถูกนำเสนอ โดย Eshima และ Tabata (2007) และ Eshima และ Tabata (2010) RCC เป็นหน่วยวัดพื้นฐานคาดการณ์วัดสามเนื่องจากมันถูกเสนอครั้งแรก ในขณะที่มาตรการสองหลังคาดการณ์พลังงานจาก RCC ด้วยเหตุนี้ เรามุ่งเน้นในมาตรการนี้พื้นฐานของอำนาจเชิงคาดการณ์ในการศึกษานี้ RCC เป็นค่าประชากรกำหนด โดยความสัมพันธ์ระหว่างตัวแปรตอบสนอง Y และความคาดหวังแบบมีเงื่อนไข ถ้าตัวแปรตอบสนอง Y มีความสัมพันธ์ที่แข็งแกร่งกับความคาดหวังแบบมีเงื่อนไข RCC มีแนวโน้มที่ 1 แล้วเราตัดสินแบบเป็นดี ในทางตรงกันข้าม ถ้า RCC มีแนวโน้มเป็น 0 แล้วเราไม่ถือว่านั่นเป็นโมเดลดี จริง RCC อยู่ระหว่าง 0 และ 1สำหรับโครงการ GLM ตัวเอง แบบฟอร์มชัดเจนของ RCC ไม่รู้จัก อย่างไรก็ตาม ในแบบจำลองถดถอยของ Poisson สมมติว่าตัวแปรทำนายมีแจก ตัวแปรพหุแบบชัดเจนของ RCC สามารถพบได้ โดยใช้แบบฟอร์มนี้ชัดเจน ที่เราประมาณการใหม่ของ RCC เสนอ และเปรียบเทียบกับการประมาณความสัมพันธ์ตัวอย่าง การประมาณ และประมาณลาหนึ่งออกตรวจสอบไขว้ในแง่อคติและ RMSE jack-knifeส่วนเหลือของกระดาษจัดเป็นดังนี้ ในส่วนที่ 2 เราอธิบายการถดถอยแบบ Poisson ในขณะที่ส่วนที่ 3 แนะนำมาตรการที่มีอยู่ของอำนาจเชิงคาดการณ์และข้อจำกัดของพวกเขา จากนั้น เรากล่าวถึงความต้องการในรายละเอียด และยืนยันว่า RCC ที่ตอบสนองพวกเขา นอกจากนี้ จะแสดงแบบฟอร์มชัดเจนของ RCC เราดำเนินการศึกษาการจำลองเพื่อเปรียบเทียบ estimators RCC ในแง่อคติและ RMSE ใน 4 ส่วน ในส่วนที่ 5 เราใช้ RCC ที่แบบ Poisson ถดถอย โดยใช้ข้อมูลจริง2. แบบจำลองถดถอย Poissonจีแอลเอ็มเมอริเดียนถูกเขียนเป็นเปิด MathJaxαเป็น คำตัด เป็นเวกเตอร์ของสัมประสิทธิ์ g(⋅) เป็นฟังก์ชันเชื่อมโยง และ D(θ) เป็นการกระจายในครอบครัวเนนกับค่าθเป็นพารามิเตอร์ แบบจำลองถดถอย Poisson อนุมานการกระจาย Poisson P(θ) เป็นโครงสร้างผิดพลาดและฟังก์ชันลอการิทึมเป็นฟังก์ชันการเชื่อมโยง แล้ว แบบจำลองถดถอย Poisson ถูกเขียนเป็นequation(1)เปิด MathJaxตั้งแต่ จากนั้นเรามีequation(2)เปิด MathJaxR

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

การศึกษาครั้งนี้จะตรวจสอบมาตรการของอำนาจการทำนายรูปแบบเชิงเส้นทั่วไป (GLM) แม้ว่าจะมีหลายมาตรการของอำนาจการทำนาย GLMs ได้รับการเสนอส่วนใหญ่จะมีข้อ จำกัด ดังนั้นเราจึงมุ่งเน้นไปที่ค่าสัมประสิทธิ์สหสัมพันธ์ (RCC) (เจิ้งเหอและอาเกรสติ, 2000) ซึ่งตอบสนองความต้องการที่สี่ (i) interpretability (ii) การบังคับใช้ (iii) ความสอดคล้องและ (iv) ความสัมพันธ์ RCC เป็นค่าประชากรที่ถูกกำหนดโดยความสัมพันธ์ระหว่างตัวแปรตอบสนองความคาดหวังและเงื่อนไขของตัวแปรการตอบสนอง ค่าตัวอย่างของมันจะถูกกำหนดโดยความสัมพันธ์ระหว่างกลุ่มตัวอย่างที่ตอบสนองค่าสังเกตและค่าประมาณของตัวแปรการตอบสนอง สำหรับพล GLM เราไม่เคยมีรูปแบบที่ชัดเจนของ RCC อย่างไรก็ตามสำหรับรูปแบบการถดถอยปัวซองสมมติว่าตัวแปรมีการแจกแจงแบบปกติหลายตัวแปรที่เราสามารถหารูปแบบที่ชัดเจนของ RCC (มูลค่าที่แท้จริง) ดังนั้นจึงเป็นไปได้ที่จะเปรียบเทียบตัวประมาณ (ค่าตัวอย่าง) ของ RCC ในแง่ของการมีอคติและ RMSE (รากของความคลาดเคลื่อน) โดยใช้มูลค่าที่แท้จริง นอกจากนี้โดยใช้แบบฟอร์มอย่างชัดเจนที่เรานำเสนอประมาณการใหม่ของ RCC สำหรับรูปแบบการถดถอยปัวซอง จากนั้นเราจะเปรียบเทียบประมาณการใหม่ที่มีการประมาณการความสัมพันธ์ตัวอย่างประมาณการแจ็คดและลาหนึ่งออกตรวจสอบประมาณการข้ามในแง่ของการมีอคติและ RMSE ออกจากหนึ่งออกตรวจสอบประมาณการข้ามมีอคติเชิงลบที่มีขนาดใหญ่และขนาดใหญ่ RMSE แม้ว่าที่เหลืออีกสามประมาณแสดงพฤติกรรมที่คล้ายกันสำหรับขนาดของกลุ่มตัวอย่างขนาดใหญ่สำหรับขนาดของกลุ่มตัวอย่างขนาดเล็กประมาณการใหม่แสดงให้เห็นพฤติกรรมที่ดีที่สุดในแง่ของการมีอคติและ RMSE. คำสัมประสิทธิ์สหสัมพันธ์ถดถอย; ตัวชี้วัดของอำนาจการพยากรณ์; ค่าสัมประสิทธิ์สหสัมพันธ์หลาย ๆ ความดีของพอดี; โมเดลเชิงเส้นตรงทั่วไป; Poisson แบบการถดถอยGadget หมดเวลาขณะโหลด1 บทนำแบบจำลองทางสถิติที่สร้างขึ้นจากข้อมูลที่ได้รับจะต้องได้รับการประเมินโดยใช้เกณฑ์บางอย่างเพื่อให้รูปแบบที่ดีที่สุดของผู้สมัครที่ได้รับเลือก ในการศึกษานี้เรามุ่งเน้นมาตรการของอำนาจการทำนายรูปแบบเฉพาะในรูปแบบเชิงเส้นทั่วไป (GLM) (ด๊อบสันและบาร์เน็ตต์, 2008 และ Nelder และ Wedderburn, 1972) ในขณะที่หลายมาตรการที่รู้จักกันดีของการใช้พลังงานคาดการณ์อยู่เช่นค่าสัมประสิทธิ์หลายสหสัมพันธ์ค่าสัมประสิทธิ์ของความมุ่งมั่นและ AIC เหล่านี้มีข้อ จำกัด ในบางสถานการณ์ (เราจะหารือถึงข้อ จำกัด ของมาตรการที่มีอยู่และความต้องการในรายละเอียดในภายหลัง). วัดของการทำนาย พลังงานความพึงพอใจความต้องการของเราได้รับการเสนอโดยเจิ้งเหอและอาเกรสติ (2000), ค่าสัมประสิทธิ์ที่เรียกว่าการถดถอยสหสัมพันธ์ (RCC) นอกจากนี้มาตรการที่คล้ายกันของอำนาจการพยากรณ์เช่นค่าสัมประสิทธิ์เอนโทรปีของความสัมพันธ์ (ECC) และค่าสัมประสิทธิ์เอนโทรปีของการตัดสินใจ (ECD) ซึ่งพึ่งพาข้อมูล Kullback-Leibler ถูกเสนอโดย Eshima และ Tabata (2007) และ Eshima และ Tabata (2010 ) RCC เป็นตัวชี้วัดขั้นพื้นฐานที่สุดของการวัดการคาดการณ์ของสามนับตั้งแต่ถูกเสนอครั้งแรกในขณะที่หลังสองมาตรการของอำนาจการทำนายอยู่บนพื้นฐาน RCC ดังนั้นเราจึงมุ่งเน้นไปที่การวัดขั้นพื้นฐานของอำนาจการพยากรณ์ในการศึกษานี้ RCC คุ้มค่าประชากรที่กำหนดโดยความสัมพันธ์ระหว่างตัวแปรตอบสนองความคาดหวังของ Y และเงื่อนไข ถ้าตอบตัวแปร Y มีความสัมพันธ์ที่แข็งแกร่งกับความคาดหวังที่มีเงื่อนไขแล้วมีแนวโน้มที่จะ RCC ที่ 1 และเราตัดสินรูปแบบที่ดี ในทางตรงกันข้ามถ้ามีแนวโน้มที่จะ RCC 0 แล้วเราไม่ได้คิดว่ามันเป็นแบบอย่างที่ดี อันที่จริง RCC อยู่ระหว่าง 0 และ 1 สำหรับ GLM โดยพลการในรูปแบบที่ชัดเจนของ RCC ไม่เป็นที่รู้จัก แต่ในรูปแบบการถดถอยปัวซองสมมติว่าตัวแปรมีการแจกแจงแบบปกติหลายตัวแปรในรูปแบบที่ชัดเจนของ RCC สามารถพบได้ โดยใช้แบบฟอร์มอย่างชัดเจนนี้เรานำเสนอประมาณการใหม่ของ RCC และเปรียบเทียบกับประมาณการความสัมพันธ์ตัวอย่างประมาณการแจ็คดและลาหนึ่งออกประมาณการการตรวจสอบข้ามในแง่ของการมีอคติและ RMSE. ส่วนที่เหลือของ กระดาษจะถูกจัดดังนี้ ในส่วนที่ 2 เราจะอธิบายรูปแบบการถดถอยปัวซองขณะที่มาตรา 3 แนะนำมาตรการที่มีอยู่ของอำนาจการพยากรณ์และข้อ จำกัด ของพวกเขา จากนั้นเราจะหารือเกี่ยวกับข้อกำหนดในรายละเอียดและยืนยันว่าพวกเขาตอบสนองความ RCC นอกจากนี้ยังมีรูปแบบที่ชัดเจนของ RCC จะแสดง เราดำเนินการศึกษาการจำลองเพื่อเปรียบเทียบตัวประมาณของ RCC ในแง่ของการมีอคติและ RMSE ในมาตรา 4 ในส่วนที่ 5 เราใช้ RCC กับรูปแบบการถดถอยปัวซองโดยใช้ข้อมูลจริง. 2 ตัวแบบการถดถอยปัวซองGLM เขียนเป็นเปิด MathJax ในที่αเป็นคำที่ตัดเป็นเวกเตอร์ของสัมประสิทธิ์กรัม (⋅) เป็นฟังก์ชั่นการเชื่อมโยงและ D (θ) คือการกระจายในครอบครัวชี้แจงกับθพารามิเตอร์ รูปแบบการถดถอยปัวซองถือว่าการกระจาย Poisson P (θ) เป็นโครงสร้างข้อผิดพลาดและฟังก์ชั่นลอการิทึมเป็นฟังก์ชั่นการเชื่อมโยง จากนั้นรูปแบบการถดถอยปัวซองเขียนเป็นสมการ (1) เปิด MathJax บนตั้งแต่แล้วเรามีสมการ (2) เปิด MathJax บนR

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

การวิจัยครั้งนี้มีวัตถุประสงค์เพื่อศึกษาถึงมาตรการของความสามารถสำหรับตัวแบบเชิงเส้น ( glm ) แม้ว่าหลายมาตรการของอำนาจพยากรณ์สำหรับ glms ได้รับการเสนอ ส่วนใหญ่มีข้อจำกัด ดังนั้น เรามุ่งเน้นวิเคราะห์สัมประสิทธิ์สหสัมพันธ์ ( RCC ) ( เจิ้ง และ agresti , 2000 ) ซึ่งตอบสนองความต้องการของ interpretability ( 4 ) , ( ii ) การใช้ ( 3 ) ความสอดคล้อง และ ( 4 ) ความสัมพันธ์กัน ที่เป็นประชากรและมูลค่าที่กำหนดโดยความสัมพันธ์ระหว่างตัวแปรและการตอบสนองต่อความคาดหวังของการตอบสนองที่มีเงื่อนไขตัวแปร ค่าของตัวอย่างที่ถูกกำหนดโดยตัวอย่างความสัมพันธ์ระหว่างค่าสังเกตการตอบสนองและการประมาณค่าของตัวแปร สำหรับ glm โดยพลการ เรา จะ ไม่ มักจะมีแบบฟอร์มที่ชัดเจนของ RCC . อย่างไรก็ตาม สำหรับการถดถอยปัวชงแบบ สมมติว่าตัวแปรหลายตัวแปรทำนายมีการแจกแจงแบบปกติ เราสามารถหารูปแบบที่ชัดเจนของเม็ดเลือดแดง ( คุณค่า ) ดังนั้นจึงเป็นไปได้ที่จะเปรียบเทียบตัวประมาณ ( ตัวอย่างค่าของเม็ดเลือดแดงในแง่อคติและ RMSE ( Root Mean Square Error ของ ) โดยใช้ค่าจริง นอกจากนี้ โดยการใช้แบบฟอร์มที่ชัดเจน เราเสนอประมาณการใหม่ของ RCC สำหรับพารามิเตอร์การถดถอยแบบ จากนั้นเราเปรียบเทียบประมาณการใหม่กับตัวอย่างความสัมพันธ์ประมาณการ , ประมาณการแจ็คมีด และปล่อยออกข้ามการตรวจสอบประมาณการในแง่อคติและ RMSE . ปล่อยออกมาตรวจสอบประมาณการข้ามมีขนาดใหญ่ลบอคติและวิธีการที่มีขนาดใหญ่ แม้ว่าจะเหลือสามตัวประมาณแสดงพฤติกรรมที่คล้ายกันสำหรับขนาดตัวอย่างใหญ่ สำหรับขนาดตัวอย่างเล็กประมาณการใหม่แสดงพฤติกรรมที่ดีที่สุดในแง่ของอคติและ RMSE .คำสำคัญสัมประสิทธิ์สหสัมพันธ์การถดถอย ; วัดความสามารถ ; สหสัมพันธ์พหุคูณ ; ความสอดคล้อง ; ตัวแบบเชิงเส้นทั่วไป รูปแบบถดถอยปัวซอแกดเจ็ตหมดเวลาในขณะที่โหลด1 . แนะนำแบบจำลองทางสถิติที่สร้างขึ้นจากข้อมูลที่ให้ต้องถูกประเมินโดยใช้เกณฑ์บางอย่างเพื่อให้ที่ดีที่สุดของผู้สมัครรุ่นที่ถูกเลือก ในการศึกษานี้จึงมุ่งวัดความสามารถสำหรับรุ่นที่เฉพาะเจาะจง , ตัวแบบเชิงเส้นทั่วไป ( glm ( ใหญ่ ) และ บาร์เน็ตต์ , 2008 และ nelder และ เวดเดอร์เบิร์น , 1972 ) ในขณะที่หลายรู้จักกันดีวัดความสามารถที่มีอยู่ เช่น สหสัมพันธ์พหุคูณ สัมประสิทธิ์การกำหนด และ ตาม เหล่านี้มีข้อจำกัดในบางสถานการณ์ ( ที่เรากล่าวถึงข้อจำกัดของมาตรการที่มีอยู่และความต้องการในรายละเอียดในภายหลัง )วัดอำนาจพยากรณ์ความพึงพอใจความต้องการของเราที่เสนอโดย เจิ้ง และ agresti ( 2000 ) , ที่เรียกว่าสัมประสิทธิ์สหสัมพันธ์ถดถอย ( RCC ) นอกจากนี้ มาตรการที่คล้ายคลึงกันของอำนาจในการทำนาย เช่น ค่าสัมประสิทธิ์สหสัมพันธ์ ( ECC ) และค่าเอนโทรปีของตัวกำหนด ( ECD ) ซึ่งอาศัยข้อมูลลี๊บเลอร์ - คัลแบ็ก ถูกเสนอโดยเอชิม่า และทาบาตะ ( 2007 ) และเอชิม่า และทาบาตะ ( 2010 ) ที่พอเหมาะคือพื้นฐานส่วนใหญ่วัดวัดทำนาย 3 ตั้งแต่มันถูกเสนอในตอนแรก ในขณะที่หลังสองวัดความสามารถตาม RCC . ดังนั้น เรามุ่งเน้นวัดนี้พื้นฐานของความสามารถในการ เป็นประชากรที่พอเหมาะ มูลค่าที่กำหนด โดยความสัมพันธ์ระหว่างการตอบสนองตัวแปร Y และความคาดหวังที่เป็นเงื่อนไข ถ้าการตอบสนองตัวแปร y มีความสัมพันธ์ที่แข็งแกร่งกับความคาดหมายตามเงื่อนไขแล้วและมีแนวโน้มที่ 1 และเราตัดสินแบบดี ในทางตรงกันข้ามหาก RCC มีแนวโน้มที่ 0 แล้วเราไม่ถือว่ามันเป็นรูปแบบที่ดี แท้จริงแล้ว และอยู่ระหว่าง 0 และ 1สำหรับ glm โดยพลการ รูปแบบ ที่ชัดเจนของ RCC จะไม่รู้จัก อย่างไรก็ตาม ในแบบจำลองการถดถอยปัวซง สมมติว่าตัวแปรทำนายมีการแจกแจงแบบปกติหลายตัวแปร , รูปแบบที่ชัดเจนของ RCC สามารถพบได้ โดยการใช้แบบฟอร์มที่ชัดเจนนี้ เราเสนอประมาณการใหม่ของ RCC และเปรียบเทียบกับตัวอย่างความสัมพันธ์ประมาณการ , ประมาณการแจ็คมีด และปล่อยออกข้ามการตรวจสอบประมาณการในแง่อคติและ RMSE .ส่วนที่เหลือของกระดาษจะจัดดังนี้ ในส่วนที่ 2 เราจะอธิบายแบบจำลองการถดถอยปัวซง ขณะที่ส่วนที่ 3 แนะนำมาตรการที่มีอยู่ของความสามารถและข้อจำกัดของตนเอง งั้น , เราจะหารือในรายละเอียด และยืนยันว่า ความต้องการและตอบสนองพวกเขา นอกจากนี้ ฟอร์มที่ชัดเจนของ RCC จะแสดง เราได้ทำการจำลองเปรียบเทียบตัวประมาณของ RCC ในแง่อคติและ RMSE ในมาตรา 4 ในส่วนที่ 5 เราใช้พอเหมาะกับการถดถอยปัวชงแบบจำลองโดยใช้ข้อมูลที่แท้จริง2 . รูปแบบถดถอยปัวซอการ glm เขียนเป็นเปิด mathjax บนที่αเป็นการสกัดกั้นในระยะเป็นเวกเตอร์ของสัมประสิทธิ์ , g ( ⋅ ) คือการเชื่อมโยงฟังก์ชัน , และ D ( θ ) คือการกระจายในครอบครัวชี้แจงกับพารามิเตอร์θ . และแบบจำลองการถดถอยปัวซอถือว่าการแจกแจงปัวซง P ( θ ) เป็นโครงสร้างข้อผิดพลาดและฟังก์ชันลอการิทึมเป็นฟังก์ชันเชื่อมโยง แล้ว จะเขียนเป็นแบบจำลองการถดถอยปัวซงสมการ ( 1 )เปิด mathjax บนเพราะ เราก็มีสมการ ( 2 )เปิด mathjax

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.