We demonstrate the special condition where the Q-learningand regressio การแปล - We demonstrate the special condition where the Q-learningand regressio ไทย วิธีการพูด

We demonstrate the special conditio

We demonstrate the special condition where the Q-learning
and regression models provide an identical prediction. This is the
case when the following three conditions hold: (1) the forgetting
and learning rates are identical (αL = αF ; F-Q model), (2) the influence of the initial action value can be neglected (e.g., the initial values are zero), and (3) the cutoff effect of the history length
(Mr) included in the regression model can be neglected. When the
first condition is not met (i.e., when the forgetting rate differs from
the learning rate), as is the case for the standard Q-learning model
(αF = 0), a dependence on choice history arises. This dependence
on choice history is relatively complex and cannot be completely
captured by a conventional regression model. This dependence on
choice history is a property of the RL model, which distinguishes
it from simple regression models. It should be noted that this apparent dependence on choice history was found only by examining
the relationship between regression models and RL models, as we
have done in the present study, rather than by simply examining
the RL model itself.
0/5000
จาก: -
เป็น: -
ผลลัพธ์ (ไทย) 1: [สำเนา]
คัดลอก!
เราแสดงให้เห็นถึงเงื่อนไขพิเศษที่การเรียนรู้ Qและรุ่นถดถอยให้การทำนายเหมือนกัน นี้เป็นการกรณีเมื่อมีเงื่อนไขสามต่อไปนี้ค้างไว้: (1) การลืมเรียนพิเศษอยู่เหมือนกัน (αL = αF รุ่น F-Q), (2) สามารถละเลยอิทธิพลของค่าเริ่มต้นการดำเนินการ (เช่น ค่าเริ่มต้นเป็นศูนย์), และ (3) ผลตัดยอดยาวประวัติ(Mr) รวมอยู่ในการถดถอยแบบจำลองสามารถละเลยได้ เมื่อการไม่เป็นไปตามเงื่อนไขแรก (เช่น เมื่อลืมอัตราแตกต่างจากอัตราการเรียนรู้), เป็นกรณีสำหรับรุ่น Q-การเรียนรู้มาตรฐาน(ΑF = 0), ประวัติเลือกที่พึ่งเกิดขึ้น พึ่งพาอาศัยกันนี้เลือกประวัติค่อนข้างซับซ้อน และไม่สมบูรณ์จับ โดยใช้แบบจำลองถดถอยธรรมดา พึ่งนี้เลือกประวัติเป็นที่รุ่น RL ซึ่งแตกต่างนอกจากรุ่นถดถอยอย่างง่าย ควรสังเกตว่า พึ่งเลือกประวัติศาสตร์นี้ปรากฏพบเท่านั้น โดยตรวจสอบความสัมพันธ์ระหว่างรุ่นถดถอยและรุ่น RL เป็นเราได้ทำ ในการศึกษาปัจจุบัน มากกว่าที่ จะเพียงแค่ตรวจสอบรุ่น RL เอง
การแปล กรุณารอสักครู่..
ผลลัพธ์ (ไทย) 2:[สำเนา]
คัดลอก!
เราแสดงให้เห็นถึงเงื่อนไขพิเศษที่ Q-การเรียนรู้
และการถดถอยรุ่นให้การทำนายเหมือนกัน นี้เป็น
กรณีที่ดังต่อไปนี้สามเงื่อนไขค้างไว้: (1) ลืม
และการเรียนรู้อัตราการอยู่เหมือนกัน (αL = αF; รุ่น FQ), (2) อิทธิพลของมูลค่าการดำเนินการเริ่มต้นสามารถละเลยเช่นค่าเริ่มต้นคือ ( ศูนย์) และ (3) ผลกระทบของความยาวตัดประวัติศาสตร์
(นาย) รวมอยู่ในรูปแบบการถดถอยสามารถละเลย เมื่อ
เงื่อนไขแรกจะไม่ได้พบกัน (เช่นเมื่ออัตราลืมความแตกต่างจาก
อัตราการเรียนรู้) เป็นกรณีสำหรับรุ่นมาตรฐาน Q-การเรียนรู้
(αF = 0), การพึ่งพาอาศัยกันในประวัติศาสตร์ทางเลือกที่เกิดขึ้น การพึ่งพาอาศัยกันนี้
ในประวัติศาสตร์ทางเลือกที่ค่อนข้างซับซ้อนและไม่สามารถสมบูรณ์
จับโดยรูปแบบการถดถอยธรรมดา การพึ่งพานี้
ประวัติศาสตร์ทางเลือกที่เป็นทรัพย์สินของรุ่น RL ซึ่งแตกต่าง
จากรูปแบบการถดถอยอย่างง่าย มันควรจะตั้งข้อสังเกตว่าการพึ่งพาอาศัยกันนี้ชัดเจนเกี่ยวกับประวัติศาสตร์ทางเลือกที่ถูกพบโดยการตรวจสอบ
ความสัมพันธ์ระหว่างรูปแบบการถดถอยและรุ่น RL ที่เรา
ได้กระทำในการศึกษาปัจจุบันมากกว่าโดยเพียงแค่การตรวจสอบ
รุ่น RL ตัวเอง
การแปล กรุณารอสักครู่..
ผลลัพธ์ (ไทย) 3:[สำเนา]
คัดลอก!
เราแสดงให้เห็นถึงเงื่อนไขพิเศษที่ q-learningและรูปแบบการถดถอยให้ทำนายเหมือนกัน นี้คือกรณีเมื่อต่อไปนี้สามเงื่อนไขถือ ( 1 ) ลืมและการเรียนรู้ราคาเหมือนกัน ( α L = α F ; รูปแบบ f-q ) , ( 2 ) อิทธิพลของค่าการกระทำเริ่มต้นสามารถละเลย ( เช่น ค่าเริ่มต้นคือศูนย์ ) และ ( 3 ) ตัดผลของความยาวประวัติ( คุณ ) อยู่ในตัวแบบการถดถอยสามารถหลง เมื่อภาพแรกไม่พบ ( เช่น เมื่อลืมอัตราที่แตกต่างจากอัตราการเรียนรู้ ) เป็นกรณีสำหรับรูปแบบ q-learning มาตรฐาน( α F = 0 ) , การพึ่งพาประวัติศาสตร์ทางเลือกที่เกิดขึ้น การพึ่งพานี้ประวัติศาสตร์ทางเลือกที่ค่อนข้างซับซ้อนและไม่สามารถจะสมบูรณ์จับโดยการถดถอยแบบปกติ นี้การพึ่งพาประวัติศาสตร์ทางเลือก เป็นสมบัติของ RL รูปแบบซึ่งแตกต่างจากแบบจำลองการถดถอยอย่างง่าย มันควรจะสังเกตว่าชัดเจนพึ่งพาประวัติศาสตร์ทางเลือก พบเพียงโดยการตรวจสอบความสัมพันธ์ระหว่างรูปแบบการถดถอยและ RL รุ่น ตามที่เราทำในการศึกษามากกว่าเพียงแค่การตรวจสอบโดยรุ่น RL นั่นเอง
การแปล กรุณารอสักครู่..
 
ภาษาอื่น ๆ
การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.

Copyright ©2025 I Love Translation. All reserved.

E-mail: