In this article, we have developed an approach particularly designed
for estimating the confidence intervals (CIs) of return levels of
the generalized extreme value distribution (GEV). The presented approach
combines the test inversion bootstrapping (TIB) with a likelihood
function. It is numerically advantageous, since by exploiting
the specific structure of the GEV, a three-dimensional bootstrapping
problem (the return level of the GEV distribution depends explicitly
on all three parameters) could be turned into an effective onedimensional
one. Our investigation has shown that for situations
where the GEV is heavy tailed, the coverage error of single as well
as double sided CIs are reasonable small. By comparing the TIB approach
to other methods, we have shown evidence that TIB is superior
to other boootstrapping approaches. Moreover, for sample sizes
up to N = 100 and return periods equal or larger than 50 years, the
TIB performs also better than the Profile Likelihood. Finally, an application
of the TIB to Gumbel distribution yielded likewise results.
The use of the TIB has been mainly advocated by Carpenter [3],
while the idea of test inversion has been around before [9], [18],
[24]. Especially DiCiccio and Romao [9] also proposed the use of
MLE in situations with nuisance parameters. However, to our best
knowledge, the TIB has never been applied to a quantity that is an
explicit function of several distribution parameters (like the return
level). Moreover, even for parameters of the GEV, we are not aware
that the performance of the TIB for heavy-tailed distributions was
studied before. While the idea of test inversion itself was used by
Burn [2], actually only a non-parametric bootstrap was performed
(and the residuals obtained for the upper quantiles were used to obtain
the lower boundary of the confidence interval and vice versa).
However, this approach is likely to encounter the problems associated
with all non-parametric bootstrap approaches for the GEV (as
outlined in [30]). Moreover, the range of the double sided CI was determined
directly by the characteristics of the sample - which is misleading,
since characteristics of the sample are not representative for
the underlying true distribution.
In contrast, the TIB approach fully embraces the fact that the distribution
fitted to the observed sample cannot directly govern the
boundaries of the CI. Hence, to determine the (100 − α)% single sided
CI for a given return value, the distribution parameters need to be estimated,
where α% of samples drawn from this distribution yield a
return level smaller than the one estimated from the observed sample.
Basically those parameters determine the boundaries of the CI. In
case of the example of Point of Rocks (Potomac River), we have shown
that the shape parameter a corresponding to the upper boundary of
the CI is much larger than the one estimated from the observed time
series. That makes sense - if the return level estimated from the observation
has underestimated the true return level, the underlying
“‘true”’ distribution must most likely have a larger a (and therefore
be more heavily tailed), since from all three parameters of the GEV
(location, scale and shape), the shape parameter is the one that is
the least constrained through the values of the observed sample. Vice
versa, if the return level estimated from observation overestimates
the true return level, the underlying ”‘true”’ distribution will be much
less heavily tailed (smaller a).
Our study shows that the presented TIB dominates other bootstrapping
approaches. Building on the work of Kyselý [30], we can
see that the best common bootstrap methods have a coverage error
(of double sided 95% CI) that exceeds the expected value by a factor
1.5–3 for the 100-year return level. In contrast, for the same return
level the TIB has deviations from the correct values around maximal
10%. However, we would like to emphasize that for a thoroughly test
of accuracy an investigation of the coverage error of double sided CI
is not sufficient, the single sided CIs needs to be studied too. As we
have observed from the use of the Profile Likelihood, both the lower
and upper boundary are underestimated. But if only double sided CIs
are considered, this error is partly compensated, which may lead to
an overoptimistic view of this method. Finally, while one could claim
that for a double sided CI, a reasonable small coverage error is suffi-
cient, real practical implications arise from the fact that the boundaries
of the CI are clearly defined (for example for the symmetric 95%
CI that the value estimated from the observed sample is within a
quantile range between 2.5% and 97.5% of the underlying true distribution).
Since that is what a CI can tell us: if the observed sample
has not been a too extreme event (defined by the confidence level) regarding
the unknown true distribution, we can expect the true value
to be within the range of the CI. Particularly in flood frequency analysis,
the upper boundary of the CI is in terms of risk assessment of
much more importance than the lower one. Therefore, we also studied
the accuracy of the single sided CIs. For sample sizes of N = 40 or
more and return periods of 50 years or more, we obtained reasonable
good values. There is a tendency that the upper boundary is slightly
overestimated, however in case of risk assessment an overestimation
might be better than an underestimation of the same magnitude.
However, for the 10-year return level, we observed greater deviations.
This might be due to the fact that return levels with smaller
return periods are directly influenced by all three parameters of the
GEV. While in case of the 1000-year return level, the location parameter
c plays a minor role, its direct influence for the 10-year return
value is much more pronounced. In such cases, many combinations
of significantly different parameter sets might have the same likelihood
(which might not be much lower than the maximum likelihood).
However, we only choose the most likely set of parameters.
Therefore, it is not surprising that significant deviations occur.
Our investigation shows that the Profile Likelihood performs
much better (regarding the coverage error of double sided CIs) than
most of the common bootstrap approaches (except the TIB), which is
in compliance with the findings of Obeysekera and Salas [37]. However
for sample sizes up to 100 and return periods equal or larger than
ในบทความนี้ เราได้พัฒนาวิธีการโดยเฉพาะอย่างยิ่งการออกแบบ
สำหรับประมาณค่าช่วงความเชื่อมั่น ( CIS ) ของระดับของผลตอบแทนแบบกระจาย
คุ้มค่ามาก ( gev ) เสนอแนวทาง
รวมทดสอบผกผัน bootstrapping ( ทิป ) กับโอกาส
ฟังก์ชัน มันคือตัวเลขที่ได้ประโยชน์ แต่โดยการใช้ประโยชน์เฉพาะโครงสร้างของ gev
,สามมิติ bootstrapping
ปัญหา ( ผลตอบแทนระดับของ gev กระจายขึ้นอย่างชัดเจน
เมื่อทั้งสามพารามิเตอร์ ) อาจจะกลายเป็นที่มีประสิทธิภาพ onedimensional
1 การสืบสวนของเราพบว่า สถานการณ์
ที่ gev หนักหาง ความครอบคลุมข้อผิดพลาดเดียวเช่นกัน
เป็นคู่หน้า CIS มีความเหมาะสมน้อย โดยเปรียบเทียบวิธีการให้ติ๊บ
วิธีการอื่น ๆเราต้องแสดงหลักฐานที่ทิปดีกว่า
boootstrapping กับวิธีการอื่น ๆ นอกจากนี้ สำหรับขนาดตัวอย่าง n =
ถึง 100 และคาบเท่ากับหรือมากกว่า 50 ปี ,
ทิปายังดีกว่าโปรไฟล์ของความน่าจะเป็น ในที่สุด การประยุกต์ของการกระจายความถี่ ติ๊บ
ใช้ให้ผลเช่นเดียวกันผลลัพธ์ ของทิปได้รับส่วนใหญ่สนับสนุนโดยช่างไม้ [ 3 ] ,
ในขณะที่ความคิดของการทดสอบได้รับรอบก่อน [ 9 ] , [ 18 ] ,
[ 24 ] โดยเฉพาะอย่างยิ่ง diciccio โรมา [ 9 ] และยังเสนอให้ใช้
mle ในสถานการณ์ที่มีตัวแปรรบกวน อย่างไรก็ตาม ความรู้ที่ดีที่สุด
ของเรา ทิปไม่เคยใช้กับปริมาณที่เป็น
ฟังก์ชันชัดเจนพารามิเตอร์ของการแจกแจงหลาย ( เช่นระดับกลับ
) ยิ่งกว่านั้น แม้แต่สำหรับพารามิเตอร์ของ gev ,เราไม่ทราบ
ว่า ประสิทธิภาพของทิปหนักการแจกแจงแบบหางยาวคือ
เรียนมาก่อน ในขณะที่ความคิดของการทดสอบเมื่อตัวเองถูกใช้โดย
เผา [ 2 ] จริงๆเท่านั้นไม่ใช้พารามิเตอร์การบู
( และคลาดเคลื่อนได้ สำหรับ quantiles ส่วนบนถูกใช้เพื่อขอรับ
ขอบล่างของช่วงความเชื่อมั่นและในทางกลับกัน ) .
อย่างไรก็ตามวิธีนี้มีโอกาสที่จะพบปัญหาเกี่ยวข้อง
กับแนวทางที่ไม่ใช้พารามิเตอร์บู ( ตามที่ระบุไว้ใน gev
[ 30 ] ) นอกจากนี้ ช่วงของคู่หน้า และ ตั้งใจ
โดยตรง โดยลักษณะของตัวอย่างที่สร้างความเข้าใจผิด เนื่องจากลักษณะของตัวอย่าง
ไม่ใช่ตัวแทน ( จริงกระจาย .
ในความคมชัดส่วนทิปวิธีการอย่างเต็มที่โอบกอดความจริงที่ว่ากระจาย
ติดตั้งเพื่อสังเกตตัวอย่างไม่สามารถโดยตรงควบคุม
ขอบเขตของ CI ดังนั้น การกำหนด ( 100 −α ) % ด้านเดียว
CI ให้คืนค่า การพารามิเตอร์ต้องประมาณ
ที่α % ของตัวอย่างได้มาจากการกระจายนี้ให้ผล
ผลตอบแทนระดับจะมีขนาดเล็กกว่าที่ประเมินจากการสังเกตตัวอย่าง
โดยทั่วไปพารามิเตอร์เหล่านั้นกำหนดขอบเขตของ CI ใน
กรณีตัวอย่างของจุดหิน ( แม่น้ำโปโตแมค ) เราได้แสดง
รูปร่างที่พารามิเตอร์ที่สอดคล้องกับขอบเขตบนของ
CI ที่ขนาดใหญ่กว่าหนึ่งโดยประมาณจากที่สังเกตเวลา
ชุด ที่สมเหตุสมผล - ถ้าผลตอบแทนระดับประเมินจากการสังเกต
ได้ประเมินระดับผลตอบแทนที่แท้จริง(
" 'true " กระจายต้องส่วนใหญ่มีขนาดใหญ่ ( และดังนั้น
เป็นหนักหาง ) เนื่องจากจากทั้งหมดสามพารามิเตอร์ของ gev
( ตำแหน่ง , ขนาดและรูปร่าง ) รูปร่างเป็นค่าหนึ่งที่
อย่างน้อยสะท้อนผ่านค่าจากตัวอย่าง รอง
ในทางกลับกัน ถ้าผลตอบแทนระดับประเมินจากการสังเกต overestimates
ระดับผลตอบแทนที่แท้จริงต้นแบบ " 'true " การกระจายจะมากน้อยหนักหาง
( ขนาดเล็ก ) .
การศึกษาของเราแสดงให้เห็นว่าเสนอทิปพนักงานอื่น bootstrapping
วิธี อาคารงานของ kysel ผลงาน [ 30 ] เราสามารถ
เห็นว่าวิธีการที่ดีที่สุดร่วมกันบูข้อผิดพลาดครอบคลุม
( คู่หน้า 95% CI ) ที่เกินกว่ามูลค่าที่คาดการณ์ไว้ โดยปัจจัย
1.5 – 3 ปี 100 คืนระดับ ในทางตรงกันข้ามสำหรับเดียวกันกลับ
ระดับทิปมีการเบี่ยงเบนจากค่านิยมที่ถูกต้องรอบสูงสุด
10 % อย่างไรก็ตาม เราต้องการจะเน้นว่าให้ถี่ถ้วนการทดสอบ
ความถูกต้องการศึกษาครอบคลุมความผิดพลาดของคู่หน้า CI
ไม่พอ ด้านเดียว CIS ต้องเรียนด้วย ขณะที่เรา
ได้สังเกตจากการใช้โปรไฟล์โอกาส ทั้งลด
และ ขอบบนเป็นดูถูก แต่ถ้าคู่หน้า CIS
ถือว่าเป็นข้อผิดพลาด นี่คือบางส่วนชดเชย ซึ่งอาจนำไปสู่
มุมมอง overoptimistic ของวิธีการนี้ ในที่สุด ในขณะที่หนึ่งสามารถเรียกร้อง
สำหรับคู่หน้า CI , ข้อผิดพลาดครอบคลุมขนาดเล็กที่เหมาะสมเป็น suffi -
cient ความหมาย ประโยชน์ที่แท้จริงเกิดขึ้นจากความจริงที่ว่าขอบเขต
ของมีไว้อย่างชัดเจน ( ตัวอย่างเช่นสำหรับสมมาตร 95%
CI ที่ค่าประมาณจากสังเกตตัวอย่างภายใน
ควอนไทล์ช่วงระหว่าง 2.5% และ 97.5 % ของต้นแบบการกระจายจริง ) .
เพราะนั่นคือ CI สามารถบอกเรา : ถ้าสังเกตตัวอย่าง
ไม่ได้มีเหตุการณ์ เกินไป ( กำหนดโดยระดับความมั่นใจเกี่ยวกับ
กระจายจริงไม่รู้จักเราสามารถคาดหวัง
มูลค่าที่แท้จริงจะอยู่ในช่วงของ CI โดยเฉพาะอย่างยิ่งในการวิเคราะห์ความถี่น้ำท่วม
ขอบเขตบนของ CI คือ ในแง่ของการประเมินความเสี่ยง
มากขึ้นความสำคัญน้อยกว่าหนึ่ง ดังนั้น เรายังเรียน
ความถูกต้องของแบบหน้าเดียว CIS สำหรับขนาดตัวอย่าง n = 40 หรือ
เพิ่มเติม และคาบของ 50 ปีหรือมากกว่า , เราได้รับค่า
ที่ดีที่เหมาะสมมีแนวโน้มว่าขอบเขตบน เล็กน้อย
overestimated , อย่างไรก็ตามในกรณีของการประเมินความเสี่ยงการประเมินมากเกินไป
อาจจะดีกว่าการการประเมินค่าต่ำไปของขนาดเดียวกัน .
แต่สำหรับระดับผลตอบแทน 10 ปี ที่เราพบการเบี่ยงเบนมากขึ้น
นี้อาจจะเนื่องจากความจริงที่ว่าผลตอบแทนระดับด้วยระยะเวลากลับเล็กกว่า
เป็น มีอิทธิพลโดยตรงจากทั้งสามพารามิเตอร์ของ
gev .ในขณะที่ในกรณีของ 1 , 000 ปี ผลตอบแทนระดับตำแหน่งพารามิเตอร์
C มีบทบาทเล็กน้อย อิทธิพลโดยตรงเพื่อกลับค่า
10 ปีเป็นมากขึ้นชัดเจน ในบางกรณี หลายชุด ชุดพารามิเตอร์ที่แตกต่างกัน
อาจจะมีโอกาสเดียวกัน ( ซึ่งอาจจะน้อยกว่า Maximum Likelihood ) .
แต่เราแค่เลือกชุดมากที่สุดของพารามิเตอร์
ดังนั้นจึงไม่น่าแปลกใจที่สำคัญการเบี่ยงเบนเกิดขึ้น .
การสืบสวนของเราพบว่าโอกาสการโปรไฟล์
ดีกว่ามาก ( เกี่ยวกับความคุ้มครองความผิดพลาดของคู่หน้า CIS ) กว่า
ที่สุดของวิธีบูทั่วไป ( ยกเว้นทิป ) ซึ่งเป็น
ตามข้อมูลและ obeysekera ซาลาส [ 37 ] อย่างไรก็ตาม
สำหรับขนาดตัวอย่างถึง 100 และคาบเท่ากับหรือมากกว่า
การแปล กรุณารอสักครู่..