States are often represented as tup

States are often represented as tuples of attributes. Because the size of the state space (in the case of Q-learning, the size of the Q-value matrix) is exponential in the number of attributes considered (this is often referred to as the “curse of dimensionality”), it is essential that the number of attributes and the resolution of each attribute be contained. This helps not only in reducing storage and speed requirements in a silicon implementation of the Q-value matrix; it also allows the RL agent to generalize, i.e., exploit knowledge acquired through past experience-in the case of Q-learning, approximate the Q-value of a previously unseen state-action pair(s, a) with the Q-value of state-action pair (s’ , a), with s and s’ sufficiently close in the state space.

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

รัฐจะแสดงมักจะเป็น tuples ของคุณลักษณะ เพราะขนาดของพื้นที่รัฐ (ในกรณีที่คิวของการเรียนรู้ขนาดของ Q-ค่าเมทริกซ์) คือชี้แจงในจำนวนของคุณลักษณะการพิจารณา (นี้มักจะถูกเรียกว่า "คำสาปแช่งของมิติ") เป็น จำเป็นอย่างยิ่งที่จำนวนของคุณลักษณะและความละเอียดของแต่ละแอตทริบิวต์ถูกบรรจุนี้จะช่วยให้ไม่เพียง แต่ในการลดการจัดเก็บและต้องการความเร็วในการดำเนินงานของซิลิกอนเมทริกซ์ Q-มูลค่า; มันยังช่วยให้ตัวแทน RL ที่จะพูดคุยคือการใช้ประโยชน์จากความรู้ที่ได้มาผ่านประสบการณ์ที่ผ่านมาในกรณีของ Q-การเรียนรู้โดยประมาณ Q มูลค่าของคู่รัฐการกระทำที่มองไม่เห็นก่อนหน้านี้ (s,) ที่มีค่า Q-ของคู่รัฐกระทำ (s '),กับ s และ s โ€ suffi ย ciently ใกล้ชิดในพื้นที่รัฐ

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

อเมริกามักแสดงเป็น tuples แอตทริบิวต์ เนื่องจากขนาดของพื้นที่รัฐ (ในกรณีของ Q-เรียน ขนาดของเมตริกซ์ค่า Q) เนนในหมายเลขของแอตทริบิวต์ที่พิจารณา (นี้มักจะเรียกว่าเป็น "แช่ง dimensionality"), มันเป็นสิ่งสำคัญว่า หมายเลขของแอตทริบิวต์และการแก้ปัญหาของแต่ละแอตทริบิวต์มีอยู่ นี้ช่วยในการลดความต้องการจัดเก็บและความเร็วในการดำเนินการซิลิคอนของเมตริกซ์ค่า Q ไม่เพียงแต่ มันยังช่วยให้ตัวแทน RL เพื่อทั่วไป เช่น โกงรู้มา โดยผ่านประสบการณ์ในกรณีของ Q-เรียน ประมาณค่า Q ดำเนินสถานะก่อนหน้านี้ unseen pair(s, a) มีค่า Q ของรัฐดำเนินการคู่ (s' เป็น), s และ s' suffi ciently ปิดในพื้นที่รัฐ

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

รัฐจะแสดงเป็น tuples ของแอตทริบิวต์บ่อยครั้ง เนื่องจากขนาดของพื้นที่ของรัฐ(ในกรณีที่มี Q - การเรียนรู้ขนาดของ Matrix Storage Q - ค่าที่)มีอย่างต่อเนื่องในจำนวนของแอตทริบิวต์ที่ได้รับการพิจารณาให้(ในส่วนนี้จะเรียกว่าเป็น"คำสาปแช่งของสวนกันกับ"ความมีมิติเดียวมักจะ")แต่เป็นสิ่งจำเป็นที่หมายเลขที่ของแอตทริบิวต์และความละเอียดของแอตทริบิวต์ที่แต่ละคนมีอยู่โรงแรมแห่งนี้จะช่วยให้ไม่ได้เท่านั้นในการลดการจัดเก็บข้อมูลและความเร็วในการนำไปใช้งานที่ซิลิกอนของ Q - มอบความคุ้มค่า Matrix Storage ;และยังช่วยให้ RL Agent เพื่อทำ,เช่น,ข้อบกพร่องได้รับความรู้ผ่านทางผ่านประสบการณ์ - ในกรณีที่มีการ Q - การเรียนรู้,โดยประมาณที่ Q - มูลค่าของที่มองไม่เห็นรัฐ - การดำเนินการคู่( S , a )พร้อมด้วยที่ Q - ความคุ้มค่าของรัฐ - การดำเนินการคู่( S ',),พร้อมด้วย suffi ' s และ S ciently อยู่ใกล้ในพื้นที่รัฐ.

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.