Zhang and Lu (2012) proposed five d

Zhang and Lu (2012) proposed five different methods to estimate bias in RF for regression. Their methods estimate
residuals and add these estimated residuals to the predicted values to correct bias. Our method is similar to theirs because
we use the estimated residuals, but we go further. We will fit a linear model with estimated residuals as the response variable
(Y) and predicted values as the explanatory variable (X). Then, we will rotate this fitted line to the horizontal line or find
the best rotation angle to minimize bias.
The RF package in R (Liaw & Wiener, 2009) offers a bias correction method using a simple linear regression (SLR). It fits
a SLR with observed values as the response variable (Y) and predicted values as the explanatory variable (X). One thing
to note is that this built-in bias correction uses the fitted values from out-of-bag samples. We will later show that using
a bias correction with all data to fit a SLR offers better performance than a bias correction only with out-of-bag samples
in real data applications. The predicted values from out-of-bag samples can be computed as follows. Suppose we have
B bootstrap samples. Basically, tree bagging method takes an average of the predicted values from B trees. Suppose we
have to compute the predicted values for the first observation. Since they are bootstrap samples, there can be samples
that the first observations are not included. Let us say that K(

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

จางและ Lu (2012) เสนอ 5 วิธีประเมินความโน้มเอียงใน RF สำหรับถดถอย วิธีการประเมินค่าคงเหลือเพิ่มเหล่านี้ประเมินค่าคงเหลือค่าคาดการณ์เพื่อแก้ไขความโน้มเอียง วิธีของเราจะคล้ายคลึงกับตนเนื่องจากเราใช้ค่าคงเหลือประมาณ แต่เราไปต่อ เราจะพอดีกับแบบจำลองเชิงเส้นกับค่าคงเหลือประมาณเป็นตัวแปรตอบสนอง(Y) และค่าคาดการณ์เป็นตัวแปรที่อธิบาย (X) จากนั้น เราจะหมุนเส้นแนวนอนบรรทัดนี้ผ่อน หรือค้นหามุมหมุนที่ดีที่สุดเพื่อลดความโน้มเอียงแพคเกจ RF R (Liaw และ Wiener, 2009) มีวิธีการแก้ไขที่ตั้งโดยใช้ตัวอย่างเชิงถดถอย (SLR) พอกล้อง SLR กับค่าสังเกตเป็นตัวแปรตอบสนอง (Y) และค่าคาดการณ์เป็นตัวแปรที่อธิบาย (X) สิ่งหนึ่งที่โปรดทราบได้ว่า การแก้ไขนี้มีที่ตั้งใช้ค่าผ่อนจากตัวอย่างเช็คของกระเป๋า เราจะแสดงหลังจากที่ใช้แก้ไขข้อมูลทั้งหมดให้พอดีกับกล้อง slr มาตั้งให้ประสิทธิภาพที่ดีกว่าการแก้ไขตั้งเท่ากับตัวอย่างเช็คของกระเป๋าในการใช้งานข้อมูลที่แท้จริง สามารถคำนวณค่าคาดการณ์จากตัวอย่างเช็คของกระเป๋าดังนี้ สมมติว่า เรามีตัวอย่างเริ่มต้นระบบ B ทั่วไป แผนภูมิวิธีการเย็บถุงใช้เวลาโดยเฉลี่ยค่าคาดการณ์จากต้นไม้ B สมมติว่า เราต้องคำนวณค่าคาดการณ์สำหรับเก็บข้อมูลแรก เนื่องจากพวกเขาจะเริ่มต้นระบบ สามารถมีตัวอย่างข้อสังเกตแรกไม่รวมการ เราบอกว่า (Kคาดการณ์ค่าสังเกตแรกจากตัวอย่างเช็คของกระเป๋าเป็นค่าเฉลี่ยของค่าคาดการณ์จาก K เหล่านี้ตัวอย่างการเอกสารนี้มีการจัดระเบียบดังนี้ ในส่วน 2 เราแนะนำวิธีของ Lu และเตียว (จางและ Lu, 2012) และ 2วิธี ใน 3 ส่วน เราเปรียบเทียบแสดงวิธีหก (เดิม RF แก้ไขตัวตั้ง การแก้ไขที่ตั้งมี SLR เตียว และ ลูของวิธีแรก หมุนเหลือ สุดหมุนมุม) ข้อมูลจำลองและห้าแตกต่างกันจริงชุดข้อมูลจากคลังข้อมูล UCI (Bache & Lichman, 2014) เราให้ข้อสังเกตสรุปใน 4 ส่วน

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

วอชิงตันโพสต์และลู (2012) ได้เสนอวิธีการที่แตกต่างกันห้าที่จะประเมินอคติใน RF สำหรับการถดถอย
วิธีการประเมินที่เหลือและเพิ่มเหลือประมาณค่าเหล่านี้เพื่อคาดการณ์ที่ถูกต้องอคติ วิธีการของเราก็คล้าย ๆ
กับพวกเขาเพราะเราใช้เหลือโดยประมาณแต่เราจะไปเพิ่มเติม เราจะพอดีกับรูปแบบเชิงเส้นที่มีเหลือประมาณเป็นตัวแปรการตอบสนอง
(Y) และค่านิยมที่คาดการณ์เป็นตัวแปรอธิบาย (X)
จากนั้นเราจะหมุนสายนี้เพื่อติดตั้งแนวนอนหรือหามุมหมุนที่ดีที่สุดเพื่อลดอคติ.
แพคเกจ RF ใน R (Liaw และ Wiener 2009) มีวิธีการแก้ไขอคติใช้การถดถอยเชิงเส้นง่าย (SLR) มันพอดีกับ
SLR ที่มีค่าเป็นตัวแปรที่สังเกตการตอบสนอง (Y) และค่านิยมที่คาดการณ์เป็นตัวแปรอธิบาย (X)
สิ่งหนึ่งที่ควรทราบก็คือว่าเรื่องนี้สร้างขึ้นในการแก้ไขอคติใช้ค่าติดตั้งจากออกจากถุงตัวอย่าง หลังจากนั้นเราจะแสดงให้เห็นว่าการใช้การแก้ไขอคติกับข้อมูลทั้งหมดเพื่อให้พอดีกับ SLR มีประสิทธิภาพดีกว่าการแก้ไขอคติเฉพาะกับกลุ่มตัวอย่างออกจากกระเป๋าในการใช้งานข้อมูลจริง ค่าที่คาดการณ์ไว้จากตัวอย่างออกจากถุงสามารถคำนวณได้ดังนี้ สมมติว่าเรามีตัวอย่างบูต B โดยทั่วไปวิธีการห่อต้นไม้ใช้เวลาเฉลี่ยของค่าทำนายจากต้นไม้ B สมมติว่าเรามีการคำนวณค่าที่คาดการณ์สำหรับการสังเกตแรก เนื่องจากพวกเขาเป็นตัวอย่างบูตอาจมีตัวอย่างที่สังเกตแรกที่จะไม่รวม ให้เราบอกว่า K (

คาดการณ์ค่าสำหรับการสังเกตแรกจากกลุ่มตัวอย่างออกจากกระเป๋าเป็นค่าเฉลี่ยของค่า K
จากที่คาดการณ์เหล่านี้ตัวอย่าง.
กระดาษนี้จะมีการจัดระเบียบดังต่อไปนี้ ในส่วนที่ 2 เราแนะนำจางและวิธีการของลู (Zhang Lu และ 2012)
และสองของเราวิธีการ ในส่วนที่ 3 เราเปรียบเทียบการแสดงหกวิธีการ (RF
เดิมในตัวแก้ไขอคติแก้ไขอคติกับSLR จางและวิธีแรกของลูหมุนที่เหลือหมุนมุมที่ดีที่สุด)
ที่มีข้อมูลการจำลองและห้าจริงที่แตกต่างกันชุดข้อมูลจากเก็บข้อมูล UCI (Bache และ Lichman 2014) เราจะให้คำพูดสุดท้ายในส่วนที่ 4

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

วันนี้เป็นวันที่ 2 แล้ว

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.