On the other hand, for the general

On the other hand, for the general case in which αL
̸= αF
, the
choice-autocorrelation factor can also influence the reward history
because it directly affects the number of identical choices that are
made after a reward is given, and this effect influences the regres-sion coefficients for the reward history, as discussed above (see
Eq. (21)). Fig. 5(B) shows the simulation results for the standard
Q-learning model with αF = 0 and illustrates one example of this
effect. As ϕ increases in a positive domain, the tendency to repeat
the same choice increases and enhances the decay of the influence
of the reward history compared to the case in which there was no
choice-autocorrelation factor (ϕ = 0). As ϕ decreases in a negative domain, the opposite effect is observed. The residual choice-autocorrelation factor has an additive effect on the regression
coefficients for the choice history, bc
. Taken together, the effects of
the choice autocorrelation factor on the dependence on the history
are largely additive and straightforward. For the general case, how-ever, this factor may modulate the dependence on reward history
through the property that we have observed in previous results,
i.e., that it depends on the number of times that the option is chosen.

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

บนมืออื่น ๆ สำหรับกรณีทั่วไปใน αL ซึ่ง̸ = ΑFการเลือก autocorrelation ปัจจัยสามารถมีอิทธิพลต่อประวัติรางวัลเนื่องจากมีผลต่อทางเลือกเหมือนกันที่โดยตรงทำตามที่กล่าวไว้ข้างต้น (ดูหลังจากได้รับรางวัล และผลกระทบนี้มีอิทธิพลต่อสัมประสิทธิ์ regres-sion สำหรับประวัติรางวัลทาง eq. ที่ (21)) มะเดื่อ 5(B) แสดงผลการจำลองมาตรฐานเรียนรู้ Q รุ่น αF = 0 และแสดงให้เห็นอย่างหนึ่งนี้ผล เป็นϕเพิ่มในโดเมนที่ดี แนวโน้มที่จะทำซ้ำทางเลือกเดียวกันเพิ่มขึ้น และช่วยเพิ่มการสลายตัวของอิทธิพลประวัติรางวัลเมื่อเทียบกับกรณีในที่ซึ่งไม่มีautocorrelation เลือกปัจจัย (ϕ = 0) เป็นϕลดลงในโดเมนที่เป็นลบ เป็นที่สังเกตผล ปัจจัยตกค้างเลือก-autocorrelation มีผลต่อการเสพติดการถดถอยค่าสัมประสิทธิ์สำหรับเลือกประวัติ bc. นำมารวมกัน ผลกระทบของตัวเลือก autocorrelation บนพึ่งประวัติเป็นสารเติมแต่งส่วนใหญ่ และตรงไปตรงมา สำหรับกรณีทั่วไป วิธีเคย ปัจจัยนี้อาจปรับพึ่งประวัติรางวัลผ่านคุณสมบัติที่เราได้สังเกตเห็นในผลลัพธ์ก่อนหน้าเช่น ว่ามันขึ้นอยู่กับจำนวนครั้งที่มีเลือกตัวเลือก

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

ในทางตรงกันข้ามสำหรับกรณีทั่วไปซึ่งαL
̸ = αF
ที่
ปัจจัยทางเลือกอัตยังสามารถมีอิทธิพลต่อประวัติศาสตร์รางวัล
เพราะมันมีผลโดยตรงต่อจำนวนตัวเลือกที่เหมือนกันที่มี
ขึ้นหลังจากได้รับรางวัลจะได้รับและผลกระทบนี้มีอิทธิพลต่อ ค่าสัมประสิทธิ์ regres-Sion สำหรับประวัติของรางวัลตามที่กล่าวข้างต้น (ดู
สม. (21)) มะเดื่อ. 5 (B) แสดงให้เห็นถึงผลการจำลองสำหรับมาตรฐาน
รุ่น Q-การเรียนรู้ด้วยαF = 0 และแสดงให้เห็นถึงหนึ่งในตัวอย่างนี้
มีผลบังคับใช้ เช่นเพิ่มφในโดเมนบวกแนวโน้มที่จะทำซ้ำ
เป็นทางเลือกเดียวที่เพิ่มขึ้นและช่วยเพิ่มการสลายตัวของอิทธิพล
ของประวัติศาสตร์รางวัลเมื่อเทียบกับในกรณีที่ไม่มี
ปัจจัยทางเลือกอัต (φ = 0) ในฐานะที่เป็นφลดลงในโดเมนลบผลตรงข้ามเป็นที่สังเกต ปัจจัยทางเลือกอัตเหลือมีผลกระทบสารเติมแต่งในการถดถอย
ค่าสัมประสิทธิ์สำหรับประวัติทางเลือก,
BC นำมารวมกันผลกระทบของ
ปัจจัยทางเลือกในอัตพึ่งพาประวัติศาสตร์
ส่วนใหญ่จะเป็นสารเติมแต่งและตรงไปตรงมา สำหรับกรณีทั่วไปวิธีการที่เคยปัจจัยนี้อาจปรับเปลี่ยนการพึ่งพาประวัติศาสตร์รางวัล
ผ่านคุณสมบัติที่เราได้ตั้งข้อสังเกตในผลก่อนหน้านี้
คือว่ามันขึ้นอยู่กับจำนวนครั้งที่ว่าตัวเลือกที่ถูกเลือก

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

บนมืออื่น ๆสำหรับกรณีทั่วไป ซึ่งα l̸ = α F,เลือกข้อมูลปัจจัยสามารถมีอิทธิพลต่อประวัติศาสตร์รางวัลเพราะมันมีผลโดยตรงต่อจำนวนของตัวเลือกที่เหมือนกันที่เป็นทำรางวัลให้ และผลกระทบนี้จะมีผลต่อ regres Sion เท่ากับรางวัลประวัติศาสตร์ดังที่กล่าวข้างต้น ( ดูอีคิว ( 21 ) ภาพที่ 5 ( b ) แสดงผลการทดสอบมาตรฐานq-learning แบบα F = 0 และแสดงให้เห็นถึงตัวอย่างของนี้ผล เป็นϕเพิ่มโดเมนบวก แนวโน้มที่จะทำซ้ำทางเลือกเดียวที่เพิ่มมากขึ้น และช่วยเพิ่มการสลายของอิทธิพลของรางวัลประวัติศาสตร์เปรียบเทียบกับกรณี ที่ไม่มีเลือกข้อมูลปัจจัย ( ϕ = 0 ) เป็นϕลดลงในโดเมน ลบ ตรงกันข้าม คือ สังเกต ที่เหลือเลือกข้อมูลปัจจัยมีผลเสริมในการถดถอยสำหรับค่าสัมประสิทธิ์เลือกประวัติศาสตร์ พ.ศ.. ถ่ายด้วยกัน ผลของปัจจัยข้อมูลทางเลือกพึ่งพาประวัติส่วนใหญ่จะเติมแต่งและตรงไปตรงมา สำหรับกรณีทั่วไป วิธีเคย ปัจจัยนี้อาจจะปรับการพึ่งพาประวัติศาสตร์รางวัลผ่านคุณสมบัติที่เราได้พบในผลลัพธ์ที่ก่อนหน้านี้คือ ว่า มันขึ้นอยู่กับจำนวนครั้งว่า ตัวเลือกที่เลือก

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.