When state transition and reward fu

When state transition and reward functions are known, dynamic programming can be successfully applied to find an optimal policy. However, in practice, RL agents do not have a complete knowledge about their environments’ models. In such circumstances, temporal difference (TD) and Monte-Carlo (MC) RL algorithms are more suitable.

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

เมื่อทราบว่าฟังก์ชันและความเปลี่ยนแปลงของรัฐ การเขียนโปรแกรมแบบไดนามิกสามารถจะนำไปใช้หานโยบายเหมาะสม อย่างไรก็ตาม ในทางปฏิบัติ RL แทนได้ความรู้ทั้งหมดเกี่ยวกับรูปแบบของสภาพแวดล้อมของพวกเขา ในสถานการณ์ ความแตกต่างชั่วคราว (TD) และอัลกอริทึม Monte Carlo (MC) RL ได้เหมาะ

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

เมื่อฟังก์ชั่นการเปลี่ยนสถานะและผลตอบแทนที่เป็นที่รู้จักกันเขียนโปรแกรมแบบไดนามิกสามารถนำมาใช้ประสบความสำเร็จในการหานโยบายที่ดีที่สุด แต่ในทางปฏิบัติตัวแทน RL ไม่ได้มีความรู้ที่สมบูรณ์เกี่ยวกับรูปแบบสภาพแวดล้อมของพวกเขา ในกรณีดังกล่าวแตกต่างชั่วคราว (TD) และ Monte-Carlo (MC) ขั้นตอนวิธีการ RL มีความเหมาะสมมาก

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

เมื่อสถานะและผลตอบแทนการทำงานเป็นพลวัตรที่สามารถใช้เรียบร้อยแล้วเพื่อหานโยบายที่ดีที่สุด อย่างไรก็ตาม ในทางปฏิบัติ , RL ตัวแทนไม่ได้มีความรู้ที่สมบูรณ์เกี่ยวกับสภาพแวดล้อมของพวกเขา ' รุ่น ในสถานการณ์เช่น ความแตกต่างชั่วคราว ( TD ) และมอนติคาร์โล ( MC ) RL ขั้นตอนวิธีจะเหมาะสมกว่า

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.