Reinforcement learning (RL) models

Reinforcement learning (RL) models have been widely used to analyze the choice behavior of humans
and other animals in a broad range of fields, including psychology and neuroscience. Linear regression-based models that explicitly represent how reward and choice history influences future choices have also
been used to model choice behavior. While both approaches have been used independently, the relation
between the two models has not been explicitly described. The aim of the present study is to describe this
relation and investigate how the parameters in the RL model mediate the effects of reward and choice
history on future choices. To achieve these aims, we performed analytical calculations and numerical
simulations. First, we describe a special case in which the RL and regression models can provide equivalent
predictions of future choices. The general properties of the RL model are discussed as a departure from
this special case. We clarify the role of the RL-model parameters, specifically, the learning rate, inverse
temperature, and outcome value (also referred to as the reward value, reward sensitivity, or motivational
value), in the formation of history dependence.
© 2015 The Author. Published by Else

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

เสริมการเรียนรู้ (RL) รุ่นมีการใช้กันอย่างแพร่หลายในการวิเคราะห์พฤติกรรมทางเลือกของมนุษย์และสัตว์อื่น ๆ มากมายของเขตข้อมูล รวมทั้งจิตวิทยาและประสาท การถดถอยแบบเชิงเส้นที่แสดงอย่างชัดเจนว่ารางวัลและเลือกประวัติอิทธิพลเลือกอนาคต ได้การใช้ต้องการเลือกลักษณะการทำงาน ในขณะที่มีการใช้ทั้งสองวิธีอิสระ ความสัมพันธ์ระหว่างสองรุ่นมีไม่ได้รับอย่างชัดเจนอธิบาย จุดมุ่งหมายของการศึกษาคือการ อธิบายนี้ความสัมพันธ์ และตรวจสอบวิธีพารามิเตอร์ในแบบจำลอง RL ไกล่เกลี่ยผลของรางวัลและทางเลือกประวัติศาสตร์ทางเลือกในอนาคต เพื่อให้บรรลุเป้าหมายเหล่านี้ เราทำการคำนวณวิเคราะห์ตัวเลขจำลอง ครั้งแรก เราอธิบายเป็นกรณีพิเศษรุ่น RL และถดถอยสามารถให้เทียบเท่าคาดคะเนในอนาคตเลือก มีการกล่าวถึงคุณสมบัติทั่วไปของรุ่น RL เป็นการเดินทางจากกรณีพิเศษนี้ เราชี้แจงบทบาทของพารามิเตอร์ RL รุ่น เฉพาะ การเรียนรู้อัตรา ผกผันอุณหภูมิ และค่าผลลัพธ์ (ยังอ้างเป็นค่ารางวัล รางวัลไว หรือสร้างแรงบันดาลใจค่า), ในการพึ่งพาประวัติ© 2015 ผู้เขียน เผยแพร่ โดยอื่น

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

การเสริมแรงการเรียนรู้ (RL) รุ่นที่ได้รับการใช้กันอย่างแพร่หลายในการวิเคราะห์พฤติกรรมการเลือกของมนุษย์
และสัตว์อื่น ๆ ในช่วงกว้างของเขตรวมทั้งจิตวิทยาและประสาท แบบจำลองการถดถอยตามเชิงเส้นอย่างชัดเจนว่าหมายถึงวิธีการให้รางวัลและการเลือกที่มีอิทธิพลต่อประวัติศาสตร์ทางเลือกในอนาคตนอกจากนี้ยังได้
ถูกนำมาใช้ในการจำลองพฤติกรรมทางเลือก ในขณะที่ทั้งสองวิธีได้ถูกนำมาใช้อย่างอิสระความสัมพันธ์
ระหว่างทั้งสองรุ่นยังไม่ได้รับการอธิบายอย่างชัดเจน จุดมุ่งหมายของการศึกษาครั้งนี้คือการอธิบายนี้
ความสัมพันธ์และตรวจสอบว่าค่าพารามิเตอร์ในรุ่น RL ที่เป็นสื่อกลางในผลกระทบของรางวัลและทางเลือกที่
ประวัติศาสตร์เกี่ยวกับทางเลือกในอนาคต เพื่อให้บรรลุเป้าหมายเหล่านี้เราดำเนินการวิเคราะห์และการคำนวณตัวเลข
การจำลอง ครั้งแรกที่เราจะอธิบายเป็นกรณีพิเศษซึ่ง RL และการถดถอยรุ่นสามารถให้เทียบเท่า
การคาดการณ์ของทางเลือกในอนาคต คุณสมบัติทั่วไปของรุ่น RL จะกล่าวถึงเป็นออกเดินทางจาก
กรณีพิเศษนี้ เราชี้แจงบทบาทของพารามิเตอร์ RL-รุ่นโดยเฉพาะอัตราการเรียนรู้ผกผัน
อุณหภูมิและความคุ้มค่าผล (ยังเรียกว่าเป็นค่ารางวัลตอบแทนความไวหรือสร้างแรงบันดาลใจ
คุ้มค่า) ในรูปแบบของการพึ่งพาอาศัยประวัติศาสตร์.
© 2015 ผู้เขียน เผยแพร่โดยอื่น ๆ

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.