the corresponding Q-value continuou

the corresponding Q-value continuously change. Thus, P(a(t) = 1)
is distributed discretely.
4.3. The effects of outcome value and learning rate in the standard
Q-learning model
We examined the influence of the outcome value parameter κ
and the learning rate αL
for the standard Q-learning model in which
the forgetting rate is zero (αF = 0). As previously discussed, if the
initial action values are all zero (i.e., Q1(1) = Q2(1) = 0), varying
the inverse temperature β has the same impact on the choice as
scaling R(t) by the same factor. Thus, varying κ is equivalent to
varying β by the same amount if we set the value of the neutral
outcome to zero. Therefore, we examined the effects of κ, instead
of β, while setting the value of the neutral outcome to zero.
Fig. 3(A) shows the estimated regression coefficients with
varying κ. As expected, the outcome value had a monotonic effect
on the regression coefficients over the entire reward history. In
addition, for the regression coefficients for choice history, the
outcome value also had a monotonic effect; the larger the κ, the
greater the negative dependence on the choice history was found
to be.

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

ค่า Q เกี่ยวข้องเปลี่ยนแปลงอย่างต่อเนื่อง ดังนั้น P(a(t) = 1)กระจายตกแต่ง4.3. ผลกระทบของผลค่าและอัตราการเรียนรู้ในมาตรฐานรุ่น Q-การเรียนรู้เราตรวจสอบอิทธิพลของผลค่าพารามิเตอร์κและอัตราการเรียนรู้ αLสำหรับรูปแบบ Q-การเรียนรู้มาตรฐานที่อัตราการลืมเป็นศูนย์ (αF = 0) ที่กล่าวถึงก่อนหน้านี้ ถ้าการค่าดำเนินการเริ่มต้นเป็นศูนย์ทั้งหมด (เช่น Q1(1) = Q2(1) = 0), แตกต่างกันβอุณหภูมิผกผันมีผลกระทบเดียวกันบนตัวเลือกได้มาตราส่วน R(t) โดยตัวคูณเดียวกัน ดังนั้น κที่แตกต่างกันจะเท่ากับβแตกต่าง ด้วยจำนวนเดียวกันถ้าเราตั้งค่าเป็นของกลางผลเป็นศูนย์ ดังนั้น เราตรวจสอบผลกระทบของκ แทนของβ ในขณะที่การตั้งค่าผลกลางเป็นศูนย์มะเดื่อ 3(A) แสดงสัมประสิทธิ์ถดถอยที่ประเมินด้วยκที่แตกต่างกัน ตามที่คาดไว้ ค่าผลมีผลต่อกแกนจากค่าสัมประสิทธิ์ถดถอยกว่าประวัติรางวัลทั้งหมด ในนอกจากนี้ สำหรับสัมประสิทธิ์การถดถอยสำหรับเลือกประวัติ การค่าผลยังมีผลต่อกแกน มีขนาดใหญ่κ การยิ่งพบพึ่งประวัติเลือกลบจะ

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

สอดคล้องกัน Q-ค่าเปลี่ยนแปลงอย่างต่อเนื่อง ดังนั้น P (A (t) = 1)
มีการกระจาย discretely.
4.3 ผลกระทบของค่าผลและอัตราการเรียนรู้ในมาตรฐาน
Q-การเรียนรู้รูปแบบ
เราตรวจสอบอิทธิพลของค่าผลκพารามิเตอร์
และอัตราการเรียนรู้αL
สำหรับมาตรฐาน Q-การเรียนรู้ในรูปแบบซึ่ง
อัตราการลืมเป็นศูนย์ (αF = 0) ตามที่กล่าวไว้ก่อนหน้านี้ถ้า
ค่าดำเนินการเริ่มต้นเป็นศูนย์ทั้งหมด (เช่นไตรมาสที่ 1 (1) = ไตรมาสที่ 2 (1) = 0), ที่แตกต่างกัน
βอุณหภูมิผกผันมีผลกระทบเช่นเดียวกับทางเลือกในขณะที่
การปรับ R (T) โดยปัจจัยเดียวกัน . ดังนั้นที่แตกต่างกันκเทียบเท่ากับการ
ที่แตกต่างกันβด้วยจำนวนเดียวกันถ้าเรากำหนดค่าของเป็นกลาง
ผลให้เป็นศูนย์ ดังนั้นเราจึงตรวจสอบผลกระทบของκแทน
ของβ, ขณะที่การตั้งค่าของผลที่เป็นกลางให้เป็นศูนย์.
รูป 3 (A) แสดงให้เห็นว่าค่าสัมประสิทธิ์การถดถอยประมาณที่มี
แตกต่างกันκ เป็นที่คาดหวังผลที่คุ้มค่ามีผลกระทบต่อเนื่อง
ในค่าสัมประสิทธิ์การถดถอยในช่วงประวัติศาสตร์ที่ได้รับรางวัลทั้งหมด ใน
นอกจากนี้สำหรับค่าสัมประสิทธิ์การถดถอยสำหรับประวัติทางเลือกที่
คุ้มค่าผลนอกจากนี้ยังมีผลกระทบต่อเนื่อง; ที่มีขนาดใหญ่κที่
มากขึ้นการพึ่งพาอาศัยกันในเชิงลบเกี่ยวกับประวัติศาสตร์ทางเลือกที่พบ
จะเป็น

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.