An Introduction to Quantile Regression and the QUANTREG ProcedureABSTR การแปล - An Introduction to Quantile Regression and the QUANTREG ProcedureABSTR ไทย วิธีการพูด

An Introduction to Quantile Regress

An Introduction to Quantile Regression and the QUANTREG Procedure
ABSTRACT
Ordinary least-squares regression models the relationship between one or more covariates X and the conditional
mean of a response variable Y given X = x. In contrast, quantile regression models the relationship
between X and the conditional quantiles of Y given X = x, so it is especially useful in applications where
extremes are important, such as environmental studies where upper quantiles of pollution levels are critical
from a public health perspective. Quantile regression also provides a more complete picture of the conditional
distribution of Y given X = x when both lower and upper or all quantiles are of interest, as in the
analysis of body mass index where both lower (underweight) and upper (overweight) quantiles are closely
watched health standards. This paper describes the new QUANTREG procedure in SAS 9.1, which computes
estimates and related quantities for quantile regression by solving a modification of the least-squares
criterion.
INTRODUCTION
This paper introduces the QUANTREG procedure, which computes estimates and related quantities for
quantile regression. For SAS 9.1, an experimental version of the procedure can be downloaded from
Software Downloads at support.sas.com.
Ordinary least-squares regression models the relationship between one or more covariates X and the
conditional mean of the response variable Y given X = x. Quantile regression, which was introduced
by Koenker and Bassett (1978), extends the regression model to conditional quantiles of the response
variable, such as the 90th percentile. Quantile regression is particularly useful when the rate of change in
the conditional quantile, expressed by the regression coefficients, depends on the quantile.
As an example of data with this structure, consider the scatterplot in Figure 1 of body mass index (BMI)
against age for 8,250 men from a four-year (1999–2002) survey by the National Center for Health Statistics.
More details about the data can be found in Chen (2004). Body mass index, defined as the ratio of weight
(kg) to squared height (m2), is a measure of overweight or underweight. The percentiles of BMI for specified
ages are of particular interest. As age increases, these percentiles provide growth patterns of BMI not only
for the majority of the population, but also for underweight or overweight extremes of the population. In
addition, the percentiles of BMI for a specified age provide a reference for individuals at that age with
respect to the population.
The curves in Figure 1 represent fitted conditional quantiles of BMI, including the median, computed with
the QUANTREG procedure for a polynomial regression model in age. During the quick growth period (ages
2 to 20), the dispersion of BMI increases dramatically; it becomes stable during middle age, and then it
contracts after age 60. This pattern suggests that an effective way to control overweight in a population is
to start in childhood.
Note that ordinary least-squares regression can be used to estimate conditional percentiles by making
a distributional assumption such as normality for the error term in the model. However, it would not be
appropriate here since the difference between each fitted percentile curve and the mean curve would be
constant with age. Least-squares regression assumes that the covariates affect only the location of the
conditional distribution of the response, and not its scale or any other aspect of its distributional shape.
The main advantage of quantile regression over least-squares regression is its flexibility for modeling data
with heterogeneous conditional distributions. Data of this type occur in many fields, including econometrics,
survival analysis, and ecology; refer to Koenker and Hallock (2001). Quantile regression provides a
complete picture of the covariate effect when a set of percentiles is modeled, and it makes no distributional
assumption about the error term in the model.
The next section provides a more formal definition of quantile regression, followed by a closer look at the use
of the QUANTREG procedure in the BMI example. A second example introduces nonparametric quantile
regression. Subsequent sections discuss various aspects of quantile regression, including algorithms for
estimating regression coefficients, confidence intervals, statistical tests, detection of leverage points and
outliers, and quantile process plots. These aspects are illustrated with a third example using economic
growth data. The last section discusses the scalability of the QUANTREG procedure.
QUANTILE REGRESSION
Quantile regression generalizes the concept of a univariate quantile to a conditional quantile given one or
more covariates.
For a random variable Y with probability distribution function
F(y) = Prob (Y  y)
the  th quantile of Y  is defined as the inverse function
Q( ) = inf {y : F(y)  }
Recall that a student’s score on a test is at the th quantile if his (or her) grade is better than 100% of the students who took the
test. The score is also said to be at the 100th percentile.
where 0 <  < 1. In particular, the median is Q(1/2).
For a random sample {y1, ..., yn} of Y , it is well known that the sample median is the minimizer of the sum
of absolute deviations
min
2R
Xn
i=1
|yi − |
Likewise, the general  th sample quantile ( ), which is the analogue of Q( ), may be formulated as the
solution of the optimization problem
min
2R
Xn
i=1
 (yi − )
where  (z) = z( − I(z < 0)), 0 <  < 1. Here I(·) denotes the indicator function.
Just as the sample mean, which minimizes the sum of squared residuals
ˆμ = argminμ2R
Xn
i=1
(yi − μ)2
can be extended to the linear conditional mean function E(Y |X = x) = x0 by solving
ˆ = argmin 2Rp
Xn
i=1
(yi − x0
i )2
the linear conditional quantile function, Q( |X = x) = x0 ( ), can be estimated by solving
ˆ ( ) = argmin 2Rp
Xn
i=1
 (yi − x0
i )
for any quantile  2 (0, 1). The quantity ˆ ( ) is called the  th regression quantile. The case  = 1/2,
which minimizes the sum of absolute residuals, corresponds to median regression, which is also known as
L1 regression.
USING THE QUANTREG PROCEDURE
The QUANTREG procedure computes the quantile function Q( |X = x) and conducts statistical inferences
on the estimated parameters ˆ ( ). This section introduces the QUANTREG procedure by revisiting the
body mass index example and by applying nonparametric quantile regression to ozone data.
Growth Charts with Body Mass Index
Smooth quantile curves have been widely used for reference charts in medical diagnosis to identify unusual
subjects, whose measurements lie in the tails of the reference distribution. This example explains how to
use the QUANTREG procedure to create growth charts for BMI.
A SAS data set named bmimen was created by merging and cleaning the 1999–2000 and 2001–2002
survey results for men published by the National Center for Health Statistics. This data set contains the

0/5000
จาก: -
เป็น: -
ผลลัพธ์ (ไทย) 1: [สำเนา]
คัดลอก!
แนะนำการ Quantile ถดถอยและกระบวนการ QUANTREGบทคัดย่อถดถอยกำลังสองน้อยสุดธรรมดาโมเดลความสัมพันธ์ระหว่าง หนึ่ง covariates X แบบมีเงื่อนไขเฉลี่ยของตัวแปรตอบสนองให้ X Y = x ในทางตรงกันข้าม ถดถอย quantile โมเดลความสัมพันธ์ระหว่าง X และ quantiles ตามเงื่อนไขของการกำหนดให้ X Y = x ดังนั้นจึงเป็นประโยชน์อย่างยิ่งในการใช้งานที่ที่สุดสำคัญ เช่นสิ่งแวดล้อมศึกษาที่ quantiles ด้านบนระดับมลพิษสำคัญจากมุมมองของสาธารณสุข Quantile ถดถอยยังมีรูปภาพสมบูรณ์แบบมีเงื่อนไขการกระจายของ Y ให้ X = x เมื่อทั้งล่าง และบน หรือ quantiles ทั้งหมดที่น่าสนใจ ในการการวิเคราะห์ดัชนีมวลกายที่ทั้งล่าง (underweight) และ quantiles (ภาวะ) ที่ด้านบนได้อย่างใกล้ชิดดูสุขภาพมาตรฐานการ เอกสารนี้อธิบายขั้นตอน QUANTREG ใหม่ใน SAS 9.1 ซึ่งจะประเมินและปริมาณที่เกี่ยวข้องสำหรับ quantile ถดถอยโดยแก้ไขปรับเปลี่ยนกำลังสองน้อยสุดเกณฑ์การแนะนำเอกสารนี้แนะนำขั้นตอนการ QUANTREG ซึ่งจะประเมินและปริมาณที่เกี่ยวข้องสำหรับquantile ถดถอย สำหรับ SAS 9.1 รุ่นทดลองของกระบวนการสามารถดาวน์โหลดได้จากดาวน์โหลดซอฟต์แวร์ที่ support.sas.comความสัมพันธ์ระหว่าง หนึ่ง covariates X โมเดลถดถอยกำลังสองน้อยสุดธรรมดาและค่าเฉลี่ยแบบมีเงื่อนไขของตัวแปรตอบสนอง Y ให้ X = x. อัพ Quantile ถดถอย ซึ่งถูกนำมาใช้โดย Koenker และ Bassett (1978), ขยายแบบจำลองถดถอยที่จะ quantiles แบบมีเงื่อนไขของการตอบสนองตัวแปร เช่น percentile 90 Quantile ถดถอยนี้มีประโยชน์อย่างยิ่งเมื่ออัตราการเปลี่ยนแปลงในquantile เงื่อนไข แสดง โดยสัมประสิทธิ์ถดถอย ขึ้นอยู่กับการ quantileเป็นตัวอย่างของข้อมูลที่มีโครงสร้างนี้ พิจารณา scatterplot ในรูปที่ 1 ของดัชนีมวลกาย (BMI)ต่ออายุสำหรับผู้ชาย 8,250 จากสี่ปี (1999-2002) สำรวจ โดยศูนย์แห่งชาติสำหรับสถิติสุขภาพรายละเอียดเพิ่มเติมเกี่ยวกับข้อมูลที่สามารถพบได้ในเฉิน (2004) ดัชนีมวลกาย กำหนดเป็นอัตราส่วนของน้ำหนัก(กก.) สูงยกกำลังสอง (m2), เป็นหน่วยวัดน้ำหนักเกินหรือ underweight Percentiles ของ BMI สำหรับระบุวัยที่สนใจโดยเฉพาะ เมื่ออายุมากขึ้น percentiles เหล่านี้มีรูปแบบการเจริญเติบโตของ BMI ไม่เพียงสำหรับส่วนใหญ่ ของประชากร แต่ยัง สำหรับสุด underweight หรือภาวะประชากร ในนอกจากนี้ percentiles ของ BMI สำหรับอายุระบุให้การอ้างอิงสำหรับบุคคลที่อายุกับเคารพประชากรเส้นโค้งในรูปที่ 1 แสดงถึงการติดตั้ง quantiles ตามเงื่อนไขของ BMI มัธยฐาน รวมคำนวณด้วยกระบวนการ QUANTREG สำหรับแบบจำลองการถดถอยพหุนามในยุค ช่วงเจริญเติบโตอย่างรวดเร็ว (อายุ2 20), เพิ่มการกระจายตัวของ BMI อย่างมาก กลายเป็นมั่นคงในช่วงวัยกลางคน และจากนั้นสัญญาหลังจากอายุ 60 รูปแบบนี้แนะนำว่า เป็นวิธีที่มีประสิทธิภาพในการควบคุมน้ำหนักเกินในประชากรเริ่มต้นในวัยเด็กหมายเหตุว่า ถดถอยกำลังสองน้อยสุดธรรมดาสามารถใช้ประเมิน percentiles เงื่อนไขโดยสมมติฐานขึ้นเช่น normality ที่สำหรับเงื่อนไขข้อผิดพลาดในแบบจำลอง อย่างไรก็ตาม มันจะไม่ที่นี่ที่เหมาะสมเนื่องจากความแตกต่างระหว่างแต่ละโค้งผ่อน percentile และเส้นโค้งหมายถึงจะค่าคงที่ มีอายุ ถดถอยกำลังสองน้อยสุดสันนิษฐานว่า covariates ที่ส่งผลกระทบต่อสถานที่ของการกระจายตามเงื่อนไขของการตอบ สนอง และไม่การ หรือด้านอื่น ๆ เป็นรูปร่างขึ้นประโยชน์หลักของ quantile ถดถอยกว่าถดถอยกำลังสองน้อยที่สุดคือ มีความยืดหยุ่นในการสร้างแบบจำลองข้อมูลมีการกระจายแตกต่างกันตามเงื่อนไข ข้อมูลชนิดนี้เกิดขึ้นในหลายสาขา รวม econometricsการวิเคราะห์ความอยู่รอด และนิเวศวิทยา ถึง Koenker และ Hallock (2001) Quantile ถดถอยให้เป็นจำลองภาพของผล covariate เมื่อชุด percentiles ครบถ้วน และทำให้ไม่ขึ้นสมมติฐานเกี่ยวกับเงื่อนไขข้อผิดพลาดในแบบจำลองหัวข้อถัดไปให้คำนิยามอย่างเป็นทางการมากขึ้นของ quantile ถด ตามการใช้ของกระบวนการ QUANTREG ในตัวอย่าง BMI ตัวอย่างที่สองแนะนำ nonparametric quantileถดถอย ส่วนต่อมาหารือ quantile ถด รวมทั้งอัลกอริทึมสำหรับด้านต่าง ๆจุดตรวจสอบยกระดับประมาณค่าสัมประสิทธิ์การถดถอย ช่วงความเชื่อมั่น การทดสอบทางสถิติ และoutliers และผืนกระบวนการ quantile ด้านเหล่านี้จะแสดงให้เห็นเป็นตัวอย่างที่สามที่ใช้เศรษฐกิจข้อมูลการเจริญเติบโต ส่วนสุดท้ายกล่าวถึงขนาดของกระบวนการ QUANTREGQUANTILE ถดถอยQuantile ถด generalizes แนวคิดของ quantile อย่างไร univariate การ quantile ตามเงื่อนไขที่กำหนดหนึ่ง หรือcovariates เพิ่มเติมสำหรับตัวแปรสุ่ม Y ด้วยฟังก์ชันแจกแจงความน่าเป็นF(y) = Prob (Y y)quantile th ของ Y ถูกกำหนดให้เป็นฟังก์ชันผกผันQ () = inf { y: F(y) }เรียกคืนที่คะแนนของนักเรียนในการทดสอบ th quantile ถ้าเกรดของเขา (หรือเธอ) จะดีกว่า 100% ของนักเรียนที่เอา การการทดสอบ คะแนนยังกล่าวเป็น 100 th percentile0 << 1 โดยเฉพาะอย่างยิ่ง ค่ามัธยฐานคือ Q(1/2)สำหรับการสุ่มตัวอย่าง {y1,... yn } Y เป็นที่รู้จักว่ามัธยฐานอย่าง minimizer ของผลรวมของส่วนเบี่ยงเบนสัมบูรณ์นาที2RXnฉัน = 1|yi − |ในทำนองเดียวกัน แบบทั่วไป th อย่าง quantile () ซึ่งเป็นอนาล็อกของ Q () อาจจะถูกกำหนดเป็นการของปัญหาเพิ่มประสิทธิภาพนาที2RXnฉัน = 1 (yi − )ที่ (z) = z (− (z < 0) ฉัน), 0 << 1 ที่นี่ I(·) แสดงฟังก์ชันบ่งชี้ก็หมายความว่าตัวอย่าง ซึ่งช่วยลดผลรวมของกำลังสองค่าคงเหลือˆμ = argminμ2RXnฉัน = 1(yi −μ) 2สามารถขยายเชิงเส้นแบบมีเงื่อนไขหมายถึงฟังก์ชัน E(Y |X = x) = x 0 โดยแก้ˆ = argmin 2RpXnฉัน = 1(yi − x 0i) 2quantile เงื่อนไขเชิงฟังก์ชัน Q (|X = x) = x 0 สามารถประเมิน(), โดยแก้()ˆ = argmin 2RpXnฉัน = 1(yi − x 0i)สำหรับการ quantile 2 (0, 1) ()ˆปริมาณคือ quantile ถดถอย th กรณี = 1/2ซึ่งช่วยลดผลรวมของค่าสัมบูรณ์คงเหลือ สอดคล้องกับถดถอยมัธยฐาน ซึ่งเรียกว่าL1 ถดถอยโดยใช้กระบวนการ QUANTREGกระบวนการ QUANTREG คำนวณฟังก์ชัน quantile Q (|X = x) และทำสถิติ inferencesใน()ˆประมาณพารามิเตอร์ ส่วนนี้แนะนำขั้นตอน QUANTREG โดย revisitingตัวอย่างดัชนีมวลร่างกายและ โดยใช้การถดถอย nonparametric quantile ข้อมูลโอโซนแผนภูมิการเติบโตที่ มีดัชนีมวลกายQuantile เรียบโค้งได้ถูกใช้สำหรับการอ้างอิงแผนภูมิในการวินิจฉัยแพทย์ระบุผิดปกติหัวข้อ วัดที่อยู่ในหางของการแจกแจงอ้างอิง ตัวอย่างนี้อธิบายวิธีการใช้ QUANTREG ขั้นตอนการสร้างแผนภูมิการเติบโตสำหรับ BMIสร้างชุดข้อมูลแบบ SAS ที่ชื่อ bmimen โดยการผสาน และทำความสะอาดปี 1999-2000 และ 2001-2002ผลสำรวจเผยแพร่ โดยศูนย์แห่งชาติสำหรับสถิติสุขภาพผู้ชาย ชุดข้อมูลนี้ประกอบด้วยการ
การแปล กรุณารอสักครู่..
ผลลัพธ์ (ไทย) 2:[สำเนา]
คัดลอก!
รู้เบื้องต้นเกี่ยวกับการถดถอยและ Quantile QUANTREG ขั้นตอน
บทคัดย่อ
สี่เหลี่ยมน้อยธรรมดารุ่นถดถอยความสัมพันธ์ระหว่างหนึ่งหรือมากกว่าหนึ่งตัวแปร X และเงื่อนไข
ค่าเฉลี่ยของตัวแปรตอบสนอง Y ให้ X = x ในทางตรงกันข้ามรุ่นถดถอย quantile ความสัมพันธ์
ระหว่าง X และ quantiles เงื่อนไขของ Y ให้ X = x จึงเป็นประโยชน์อย่างยิ่งในการใช้งานที่
มีความสำคัญสุดขั้วเช่นการศึกษาด้านสิ่งแวดล้อมที่ quantiles บนของระดับมลพิษมีความสำคัญ
จากมุมมองของสุขภาพของประชาชน . การถดถอย Quantile ยังให้ภาพที่สมบูรณ์มากขึ้นของเงื่อนไข
การกระจายของ Y ให้ X = x เมื่อทั้งบนและล่างหรือ quantiles ทั้งหมดเป็นที่สนใจในขณะที่
การวิเคราะห์ดัชนีมวลกายที่ทั้งต่ำ (หนัก) และบน (น้ำหนักเกิน) quantiles อย่างใกล้ชิด
เฝ้าดูมาตรฐานด้านสุขภาพ กระดาษนี้จะอธิบายขั้นตอน QUANTREG ใหม่ใน SAS 9.1 ซึ่งคำนวณ
ประมาณการและปริมาณที่เกี่ยวข้องสำหรับการถดถอย quantile โดยการแก้การปรับเปลี่ยนอย่างน้อยสี่เหลี่ยม
เกณฑ์.
บทนำ
บทความนี้จะแนะนำขั้นตอน QUANTREG ซึ่งคำนวณประมาณการและปริมาณที่เกี่ยวข้องสำหรับ
การถดถอย quantile สำหรับ SAS 9.1 เวอร์ชันทดลองของขั้นตอนสามารถดาวน์โหลดได้จาก
การดาวน์โหลดซอฟแวร์ที่ support.sas.com.
สี่เหลี่ยมน้อยธรรมดารุ่นถดถอยความสัมพันธ์ระหว่างหนึ่งหรือมากกว่าหนึ่งตัวแปร X และ
เงื่อนไขค่าเฉลี่ยของตัวแปรตอบสนอง Y ให้ X = x . การถดถอย Quantile ซึ่งเป็นที่รู้จัก
โดย Koenker และเซทท์ (1978) ขยายตัวแบบการถดถอยเพื่อ quantiles เงื่อนไขของการตอบสนอง
ตัวแปรเช่นร้อยละ 90 การถดถอย Quantile เป็นประโยชน์อย่างยิ่งเมื่ออัตราการเปลี่ยนแปลงใน
quantile เงื่อนไขแสดงโดยค่าสัมประสิทธิ์การถดถอยขึ้นอยู่กับ quantile.
เป็นตัวอย่างของข้อมูลที่มีโครงสร้างนี้พิจารณา scatterplot ในรูปที่ 1 ของดัชนีมวลกาย (BMI)
กับอายุ สำหรับ 8,250 คนจากสี่ปี (1999-2002) สำรวจโดยศูนย์แห่งชาติสำหรับสถิติสุขภาพ.
รายละเอียดเพิ่มเติมเกี่ยวกับข้อมูลสามารถพบได้ในเฉิน (2004) ดัชนีมวลกายหมายถึงอัตราส่วนของน้ำหนัก
(กก.) ความสูงยกกำลังสอง (m2) เป็นตัวชี้วัดที่มีน้ำหนักเกินหรือน้อย เปอร์เซนต์ของค่าดัชนีมวลกายสำหรับระบุ
ทุกเพศทุกวัยมีความสนใจโดยเฉพาะอย่างยิ่ง ในขณะที่การเพิ่มขึ้นของอายุเปอร์เซนต์เหล่านี้ให้รูปแบบการเจริญเติบโตของค่าดัชนีมวลกายไม่เพียง แต่
สำหรับส่วนใหญ่ของประชากร แต่ยังหนักสุดขั้วหรือมีน้ำหนักเกินของประชากร ใน
นอกจากนี้เปอร์เซนต์ของค่าดัชนีมวลกายสำหรับอายุที่ระบุให้การอ้างอิงสำหรับบุคคลที่ว่าอายุที่มี
ความเคารพต่อประชากร.
เส้นโค้งในรูปที่ 1 เป็นตัวแทนติดตั้ง quantiles เงื่อนไขของค่าดัชนีมวลกายรวมทั้งแบ่งคำนวณกับ
ขั้นตอน QUANTREG สำหรับการถดถอยพหุนาม รูปแบบในยุค ในช่วงระยะเวลาการเจริญเติบโตอย่างรวดเร็ว (อายุ
2-20), การกระจายตัวของดัชนีมวลกายเพิ่มขึ้นอย่างมาก; มันจะกลายเป็นมีเสถียรภาพในช่วงวัยกลางคนแล้วก็
สัญญาหลังจากอายุ 60 แบบนี้แสดงให้เห็นว่าวิธีที่มีประสิทธิภาพในการควบคุมน้ำหนักตัวมากเกินในประชากรคือ
การเริ่มต้นในวัยเด็ก.
โปรดทราบว่ากำลังสองน้อยที่สุดสามัญถดถอยสามารถนำมาใช้ในการประเมินเปอร์เซนต์เงื่อนไขโดยการ
สมมติฐานกระจายเช่นปกติสำหรับการผิดพลาดในรูปแบบ แต่มันจะไม่
เหมาะสมที่นี่ตั้งแต่ความแตกต่างระหว่างเส้นโค้งแต่ละเปอร์เซ็นต์ติดตั้งและเส้นโค้งหมายถึงจะเป็น
อย่างต่อเนื่องกับอายุ การถดถอยน้อยสี่เหลี่ยมอนุมานว่าตัวแปรมีผลเฉพาะสถานที่ตั้งของ
เงื่อนไขการจำหน่ายของการตอบสนองและไม่ใหญ่หรือด้านอื่น ๆ ของรูปร่างกระจายของมัน.
ประโยชน์หลักของการถดถอย quantile กว่าถดถอยอย่างน้อยสี่เหลี่ยมมีความยืดหยุ่นสำหรับการสร้างแบบจำลองข้อมูล
กับการกระจายเงื่อนไขที่แตกต่างกัน ข้อมูลประเภทนี้เกิดขึ้นในหลายสาขารวมทั้งเศรษฐ,
การวิเคราะห์การอยู่รอดและนิเวศวิทยา; อ้างถึง Koenker และฮอลล็อค (2001) การถดถอย Quantile ให้
ภาพที่สมบูรณ์ของผลกระทบตัวแปรร่วมเมื่อชุดของเปอร์เซนต์เป็นแบบจำลองและจะทำให้ไม่มีการกระจาย
สมมติฐานเกี่ยวกับระยะผิดพลาดในรูปแบบ.
ส่วนถัดไปมีความหมายอย่างเป็นทางการของการถดถอย quantile ตามด้วยการมองใกล้ที่ การใช้งาน
ของขั้นตอน QUANTREG ในตัวอย่างค่าดัชนีมวลกาย ตัวอย่างที่สองแนะนำ nonparametric quantile
ถดถอย ส่วนภายหลังการหารือเกี่ยวกับแง่มุมต่าง ๆ ของการถดถอย quantile รวมถึงขั้นตอนวิธีการสำหรับ
การประมาณค่าสัมประสิทธิ์การถดถอย, ช่วงความเชื่อมั่น, การทดสอบทางสถิติการตรวจสอบจุดที่ยกระดับและ
ค่าผิดปกติและแปลงกระบวนการ quantile ลักษณะเหล่านี้จะแสดงกับตัวอย่างที่สามโดยใช้เศรษฐกิจ
ข้อมูลการเจริญเติบโต ส่วนสุดท้ายกล่าวถึงการขยายขีดความสามารถของขั้นตอน QUANTREG.
quantile ถดถอย
ถดถอย Quantile generalizes แนวคิดของ quantile univariate เพื่อ quantile เงื่อนไขที่กำหนดหนึ่งหรือ
ตัวแปรอื่น ๆ อีกมากมาย.
สำหรับตัวแปรสุ่ม Y ที่มีความน่าจะเป็นฟังก์ชันการแจกแจง
F (Y) = Prob (Y? Y)
? th quantile ของ Y? ถูกกำหนดให้เป็นฟังก์ชันผกผัน
(?) q = INF {y: F (Y)? ?}
? จำได้ว่าคะแนนของนักเรียนในการทดสอบอยู่ที่? th quantile ถ้าเขา (หรือเธอ) เกรดดีกว่า 100% ของนักเรียนที่เข้ามา
ทดสอบ คะแนนมีการกล่าวยังเป็นที่ 100 th เปอร์เซ็นต์.
ที่ 0 <? <1 โดยเฉพาะอย่างยิ่งแบ่งเป็นคิว (1/2).
สำหรับตัวอย่างที่สุ่ม {y1, ... YN} ของ Y เป็นที่รู้จักกันดีว่าการแบ่งกลุ่มตัวอย่างเป็นผืนของผลรวม
ของส่วนเบี่ยงเบนแน่นอน
นาที
? 2R
Xn
i = 1
| ยี่ -? |
ทำนองเดียวกันทั่วไป? quantile ตัวอย่าง th? (?) ซึ่งเป็นอะนาล็อกของ Q (?) อาจจะเป็นสูตร
การแก้ปัญหาการเพิ่มประสิทธิภาพ
นาที
? 2R
Xn
i = 1
?? (ยี่ -?)
ที่ ?? (Z) = z (เท - ฉัน (Z <0)) 0 <? <1. นี่ฉัน (·) หมายถึงการทำงานของตัวบ่งชี้.
เช่นเดียวกับตัวอย่างหมายถึงซึ่งช่วยลดผลรวมของกำลังสองเหลือ
μ = argminμ2R
Xn
i = 1
(ยี่ - μ) 2
สามารถขยายไปยังเชิงเส้นค่าเฉลี่ยเงื่อนไขฟังก์ชั่น E ( Y | X = x) = x0 โดยการแก้
= argmin 2RP
Xn
i = 1
(ยี่ - x0
i) 2
ฟังก์ชั่น quantile เชิงเส้นเงื่อนไข Q (? | X = x) = x0 () สามารถประมาณโดยการแก้
(?) = argmin 2RP
Xn
i = 1
?? (ยี่ - x0
i)
สำหรับ quantile ใด? 2 (0, 1) ปริมาณ (?) ที่เรียกว่า? การถดถอย th quantile กรณี? = 1/2,
ซึ่งช่วยลดผลรวมของเหลือแน่นอนสอดคล้องกับการถดถอยเฉลี่ยซึ่งเป็นที่รู้จักกันในนาม
ถดถอย L1.
ใช้ QUANTREG ขั้นตอน
ขั้นตอน QUANTREG คำนวณฟังก์ชัน quantile Q (? | X = x) และดำเนินการหาข้อสรุปทางสถิติ
เกี่ยวกับ พารามิเตอร์โดยประมาณ (?) ส่วนนี้จะแนะนำขั้นตอน QUANTREG โดย revisiting
ตัวอย่างเช่นดัชนีมวลกายและโดยใช้การถดถอย nonparametric quantile ข้อมูลโอโซน.
แผนภูมิการเจริญเติบโตที่มีดัชนีมวลกาย
โค้ง quantile เรียบได้รับการใช้กันอย่างแพร่หลายสำหรับแผนภูมิการอ้างอิงในการวินิจฉัยทางการแพทย์ที่ผิดปกติในการระบุ
วิชาที่มีวัดอยู่ หางของการกระจายการอ้างอิง ตัวอย่างนี้จะอธิบายวิธีการ
ใช้ขั้นตอน QUANTREG สร้างแผนภูมิการเจริญเติบโตของค่าดัชนีมวลกาย.
ชุดข้อมูล SAS ชื่อ bmimen ถูกสร้างขึ้นโดยการควบรวมกิจการและการทำความสะอาด 1999-2000 และ 2001-2002
ผลการสำรวจสำหรับผู้ชายที่ตีพิมพ์โดยศูนย์แห่งชาติเพื่อสุขภาพสถิติ ข้อมูลชุดนี้ประกอบด้วย

การแปล กรุณารอสักครู่..
ผลลัพธ์ (ไทย) 3:[สำเนา]
คัดลอก!
แนะนำขั้นตอนและกระบวนการควอนไทล์ quantreg นามธรรม

ปกติวิธีถดถอยแบบความสัมพันธ์ระหว่างหนึ่งหรือมากกว่าความรู้ X และเงื่อนไข
หมายถึงการตอบสนองตัวแปร Y ให้ X = X . ในทางตรงกันข้าม , ควอนไทล์ถดถอยรูปแบบความสัมพันธ์
ระหว่าง X และ Y quantiles ตามเงื่อนไขให้ x = x , ดังนั้นมันจึงเป็นประโยชน์ โดยเฉพาะอย่างยิ่งในการใช้งานที่
สุดขั้วเป็นสำคัญ เช่น การศึกษาสิ่งแวดล้อมที่ด้านบน quantiles ระดับมลพิษที่สำคัญ
จากสาธารณสุขมุมมอง ควอนไทล์ถดถอยยังให้ภาพที่สมบูรณ์มากขึ้นของการกระจายแบบมีเงื่อนไข
Y ให้ x = x เมื่อทั้งบนและล่าง หรือ ทั้งหมด quantiles มีความสนใจใน
การวิเคราะห์ดัชนีมวลร่างกายที่ทั้งล่าง ( underweight ) และด้านบน ( อ้วน ) quantiles อย่างใกล้ชิด
ดูมาตรฐานสุขภาพ กระดาษนี้จะอธิบายขั้นตอน quantreg ใหม่ใน SAS 9.1 ซึ่งคำนวณประมาณการปริมาณ
และที่เกี่ยวข้องกับการแก้ไขดัดแปลงโดย ควอนไทล์ของวิธี


แนะนำเกณฑ์ กระดาษนี้แนะนำ quantreg ขั้นตอน ,ซึ่งคำนวณจากปริมาณที่เกี่ยวข้องสำหรับ
ควอนไทล์การถดถอย SAS ส่วนรุ่นทดลองของกระบวนการสามารถดาวน์โหลดได้จาก
ดาวน์โหลดซอฟต์แวร์ที่สนับสนุน เช่น . com .
ธรรมดาวิธีการหนึ่งหรือมากกว่าหนึ่งรูปแบบความสัมพันธ์ระหว่างความรู้และเงื่อนไขของ x
หมายถึงการกำหนดตัวแปร x y = x
ควอนไทล์ถดถอย ซึ่งแนะนำโดย koenker Bassett ( 1978 ) และขยายแบบจำลองการถดถอยในเงื่อนไขของการ quantiles
ตัวแปรเช่นร้อยละ 90 . ควอนไทล์ถดถอยเป็นประโยชน์โดยเฉพาะอย่างยิ่งเมื่อการเปลี่ยนแปลงอัตรา
ควอนไทล์ในเงื่อนไข แสดงโดยสัมประสิทธิ์ถดถอย ขึ้นอยู่กับควอนไทล์ .
เป็นตัวอย่างของข้อมูลที่มีโครงสร้างนี้พิจารณา scatterplot ในรูปที่ 1 ของดัชนีมวลร่างกาย ( BMI )
กับ 8250 ผู้ชายอายุ 4 ปี ( ปี 1999 - 2002 ) สำรวจโดยศูนย์สถิติสุขภาพแห่งชาติ .
รายละเอียดเพิ่มเติมเกี่ยวกับข้อมูลที่สามารถพบได้ใน เฉิน ( 2004 ) ดัชนีมวลร่างกาย หมายถึง อัตราส่วนของน้ำหนัก ( กิโลกรัม ) ส่วนสูงยกกำลังสอง
( M2 ) คือ การวัดน้ำหนักตัวมากเกินหรือต่ำ ที่เป็นเปอร์เซ็นต์ของค่าดัชนีมวลกายสำหรับระบุ
ทุกเพศทุกวัยมีความสนใจเฉพาะ เป็นการเพิ่มอายุ เปอร์เซ็นต์เหล่านี้มีรูปแบบการเจริญเติบโตของ BMI ไม่เพียง
สำหรับส่วนใหญ่ของประชากร แต่ยังต่ำ หรืออ้วนสุดขั้วของประชากร ใน
ส่วนเปอร์เซ็นต์ของค่าดัชนีมวลกายสำหรับอายุที่ระบุให้การอ้างอิงสำหรับบุคคลวัยนี้ด้วย

ส่วนประชากรเส้นโค้งในรูปที่ 1 แสดงการติดตั้ง quantiles เงื่อนไขของค่าดัชนีมวลกายรวมทั้งมัธยฐาน คำนวณกับ
ขั้นตอน quantreg สำหรับการวิเคราะห์การถดถอยพหุนามในยุค ในช่วงระยะเวลาการเจริญเติบโตอย่างรวดเร็ว ( อายุ
2 ( 20 ) , การเพิ่มขึ้นของค่าดัชนีมวลกายอย่างมาก มันกลายเป็นมีเสถียรภาพในช่วงวัยกลางคน แล้วมัน
สัญญาหลังจากอายุ 60รูปแบบนี้ชี้ให้เห็นว่าวิธีที่มีประสิทธิภาพในการควบคุมโรคอ้วนในประชากรเริ่มต้นในวัยเด็ก
.
ทราบว่าวิธีการปกติสามารถใช้ในการประมาณการเปอร์เซ็นต์ตามเงื่อนไข โดยการสุ่ม
อัสสัมชัญเช่นปกติในระยะข้อผิดพลาดในรูปแบบ แต่มันจะไม่ถูก
ที่เหมาะสมที่นี่ เนื่องจากความแตกต่างระหว่างแต่ละค่าติดตั้งโค้งและหมายถึงเส้นโค้งจะ
คงที่กับอายุ การถดถอยกำลังสองน้อยที่สุดถือว่าความรู้มีผลต่อเฉพาะตำแหน่งของ
เงื่อนไขกระจายการตอบสนอง และด้านอื่น ๆของขนาดหรือรูปร่าง
สุ่ม .ประโยชน์หลักของการถดถอยกว่าวิธีควอนไทล์สมการคือความยืดหยุ่นของการจำลองข้อมูลตามเงื่อนไขการแจกแจงข้อมูล
ด้วย . ข้อมูลประเภทนี้เกิดขึ้นในหลายด้าน รวมถึงเศรษฐมิติการวิเคราะห์และนิเวศวิทยา
, , อยู่รอด ; อ้างถึง และ koenker Hallock ( 2001 ) ควอนไทล์ถดถอยให้
ภาพที่สมบูรณ์ของชุดผลเมื่อชุดของเปอร์เซ็นไทล์เป็นหุ่นจำลองและมันไม่สุ่ม
ข้อสมมติเกี่ยวกับในระยะข้อผิดพลาดในรูปแบบ .
ส่วนถัดไปมีการนิยามของควอนไทล์ถดถอยลงมามองใกล้ที่ใช้
ของกระบวนการ quantreg ในค่าเช่น ตัวอย่างที่สองเปิดตัวควอนไทล์
การถดถอย ต่อมาส่วนที่หารือด้านต่างๆของควอนไทล์ถดถอย รวมทั้งขั้นตอนวิธีสำหรับ
การประมาณค่าสัมประสิทธิ์การถดถอยความเชื่อมั่นการทดสอบทางสถิติ การตรวจหาจุด leverage และ
ผิดปกติ และกระบวนการควอนไทล์แปลง ลักษณะเหล่านี้มีภาพประกอบกับสามตัวอย่างที่ใช้ข้อมูลการเติบโตทางเศรษฐกิจ

ส่วนสุดท้ายกล่าวถึงการทำงานของกระบวนการ quantreg ถดถอย
.
ควอนไทล์ควอนไทล์ถดถอยเช่นนี้ได้ขยายแนวคิดของควอนไทล์ เพื่อรักษาเงื่อนไขควอนไทล์ได้รับความรู้เพิ่มเติมหรือ
.
สำหรับฟังก์ชันการแจกแจงความน่าจะเป็นตัวแปรสุ่ม Y
F ( Y ) ( Y  prob = Y )
 th ควอนไทล์ของ Y  หมายถึงฟังก์ชันผกผัน
Q (  ) = inf { Y : f ( y )   }
 จำได้ว่าเป็นนักเรียนคะแนนในการทดสอบที่  th ควอนไทล์ ถ้าเขา ( หรือเธอ ) เกรดดีกว่า 100 % ของนักศึกษาที่เรียน 
ทดสอบ คะแนนก็บอกว่าจะอยู่ที่ 100  th ? .
ที่ 0 <  < 1 โดยเฉพาะอย่างยิ่ง มัธยฐานคือ Q ( 1 / 2 ) .
สำหรับการสุ่มตัวอย่าง y1 } { , Y . . . . . ในที่สุดก็เป็นที่รู้จักกันดีว่ามัธยฐานตัวอย่างเป็นผู้ทำให้มีค่าน้อยลงของผลรวมของค่า

แน่นอนมิน

ซิน  2R = 1

ฉัน| ยี−  |
โดย th  ทั่วไปตัวอย่างควอนไทล์  (  ) ซึ่งเป็นอะนาล็อกของ Q (  ) อาจกำหนดเป็นทางออกของปัญหาที่เหมาะสม




ซินมิน  2R = 1
  ( ยี−  )
  ( ที่ ) Z = z (  − i ( Z < 0 ) ) , 0 <  < 1 ที่นี่ฉัน ( ด้วย ) หมายถึงการทำงาน .
เช่นเดียวกับค่าเฉลี่ยตัวอย่างซึ่งช่วยลดผลรวมของค่าคลาดเคลื่อนกำลังสองˆμ =


ผมซิน argmin μ 2R = 1
( ยี− 2
μ )สามารถขยายไปยังฟังก์ชันเชิงเส้นที่มีเงื่อนไขว่า E ( Y | x = x = x0 แก้
ˆ = argmin 2rp
ซิน

( ยีผม = 1 − x0
ฉัน ) 2
ควอนไทล์เป็นฟังก์ชันเชิงเส้น , Q (  | x = x = x0 (  ) สามารถประมาณได้โดยการแก้
ˆ (  ) = argmin 2rp

ผมซิน = 1
  ( ยี− x0

ผม ) ใด ๆ  ควอนไทล์ 2 ( 0 , 1 ) ปริมาณˆ (  ) เรียกว่า  th ถดถอยควอนไทล์ . กรณี 
= 1 / 2ซึ่งช่วยลดผลรวมของค่าคลาดเคลื่อนสัมบูรณ์เฉลี่ยสอดคล้องกับสมการถดถอย ซึ่งจะเรียกว่า L1

คน โดยใช้วิธีการ quantreg
ขั้นตอน quantreg คำนวณฟังก์ชันควอนไทล์ Q (  | X = X ) และความประพฤติ
สรุปสถิติประมาณการพารามิเตอร์ˆ (  ) ในส่วนนี้แนะนำขั้นตอน quantreg โดย revisiting
การแปล กรุณารอสักครู่..
 
ภาษาอื่น ๆ
การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.

Copyright ©2024 I Love Translation. All reserved.

E-mail: