3.2 LearningAlthough the above models extend the scope of traditional  การแปล - 3.2 LearningAlthough the above models extend the scope of traditional  ไทย วิธีการพูด

3.2 LearningAlthough the above mode

3.2 Learning
Although the above models extend the scope of traditional economic models of
managerial decision-making, they are agnostic on the process of how markets might
reach equilibrium. Likewise, empirical applications of these models also assume that
equilibrium has either already been reached, or if there are multiple equilibria,
equilibrium selection has already taken place. Data from laboratory experiments,
however, show a more nuanced picture. In most experiments, at least for the first fewrounds, observed behavior is far from (any) equilibrium (Roth and Erev 1995;
Camerer 2003). If equilibration occurs, the equilibrium is reached through some
iterative adaptive process, which we will follow convention and refer to as learning.
The growing theory and experimental literature on learning in games has examined
when and how non-standard strategies in games persist. Focusing on different
methods of learning, this literature has shed light on some long-standing issues in
equilibrium models of non-cooperative games.

3.2.1 Learning and equilibrium selection
As discussed earlier, learning has been a particularly fruitful approach in predicting
which equilibrium will be selected in games with multiple Nash equilibria. In the
class of potential games, for example, several belief-based learning models converge
to the potential maximizing equilibrium (Monderer and Shapley 1996). Combining
the classical belief-based learning approach with group-contingent social preferences,
Chen and Chen (2011) propose a theoretical model of social identity and derive
conditions under which social identity changes equilibrium selection by changing the
potential function. Specifically, when people feel more altruistic towards their
ingroup members (Chen and Li 2009), they will exert higher equilibrium effort in
the sense of first-order stochastic dominance in a minimum effort game. To test the
ability of this model to predict behavior in the laboratory, they design an experiment
using the minimum effort games of Van Huyck et al. (1990) with parameter configurations
where learning would result in convergence to the inefficient, low-effort
equilibrium absent of group identity (Goeree and Holt 2005). In their near-minimal
treatments, they show that while matching subjects with ingroup or outgroup members
has some effect on the effort levels chosen they are not statistically distinguishable
from the control, where no groups are induced. On the other hand, when they
enhance the groups by allowing them to communicate with group members in solving
a simple task before playing the minimum effort game, they find that matching
subjects with ingroup members has a statistically significant positive effect on the
subjects’ provided efforts. Thus, consistent with the model, ingroup matching significantly
increases coordination and efficiency. This paper contributes to the theoretical
foundations of social identity by demonstrating that, by using a simple groupcontingent
social preference model, it is possible to endogenize the exogenous norms
in the original Akerlof and Kranton social identity models (2000, 2005) and to
reconcile the theory with experimental findings in a number of coordination games.
The results also have practical implications for organization design. Organizations
are more frequently encountering the issue of integrating a diverse workforce, and
motivating members coming different backgrounds to work towards a common goal.
Chen and Chen (2011) demonstrate that creating a deep sense of common identity can
motivate people to exert more effort to reach a more efficient outcome. A successful
application of this idea comes from Kiva (http://www.kiva.org/), a person-to-person
microfinance lending site, which organizes loans to entrepreneurs around the globe.
In August 2008, Kiva launched its lending teams program which organizes lenders
into identity-based teams. Any lender can join a team based on her school, religion,
geographic location, sports, or other group affiliations. The lending teams program
significantly increases the amount of funds raised.

3.2.2 Biological basis of learning
In numerous laboratory experiments, the general finding is that, for nontrivial games,
players gradually reach equilibrium over time through some process of adaptation,
typically referred to as learning (Camerer 2003, Chapter 6). A number of models of
learning in games have been proposed, particularly reinforcement and belief-based
models, as well as hybrid models such as experienced weighted attraction (EWA) (see
Camerer and Ho 1999 and Ho et al. 2007).
Hsu et al. (2010) build upon this literature by studying the neural mechanisms
underlying strategic learning using functional magnetic resonance imaging (fMRI). This
is a potentially fruitful endeavor as the neural mechanisms of learning have been
revolutionized from the discovery of a class of neurons, namely the dopamine neurons,
that appear to implement the temporal difference (TD) form of reinforcement learning.
Derived from behavioral psychology and machine learning literatures, at the core of TD
learning is the computation and updating of a reward prediction error (RPE), whereby
organisms (in this case players) learn from the discrepancy between what is expected to
happen and what actually happens (Sutton and Barto 1981). This includes a number of
recent papers implicating such dopaminergic regions in decisions under risk and
uncertainty (e.g., Fiorillo et al. 2003). More importantly from the perspective of
strategic learning, this literature offers a set of biologically plausible formal models of
behaviour that has the potential to directly connect behavioral observations of
learning dynamics in games on the one hand (Roth and Erev 1995; Camerer 2003),
and the neural observations of the brain dynamics on the other.
Specifically, Hsu et al. (2010) used an asymmetric version of the patent race game,
first studied experimentally in Rapoport and Amaldoss (2000), to search for regions
of the brain involved in computation of expected payoffs and prediction errors that
can be used to guide behavior. The large strategy space of this game improves the
recovery of key parameters in learning models relative to smaller games typically
used in such studies (Wilcox 2006).
Reinforcement and belief-based models were implemented in the manner consistent
with temporal difference models (Sutton and Barto 1981) and fitted to the neural
data. The results show evidence of reinforcement and belief-based learning signals in
the manner predicted by EWA learning. Somewhat surprisingly, these distinct signals
are represented in both overlapping and distinct brain regions. There are a number of
potential extensions to this study. First, despite the empirical success of the aforementioned
models, the model fits are far from perfect. Belief-learning in particular, relies on
strong functional form assumptions regarding the construction of beliefs, which has longbeen assumed in standard models to be unobservable. Recent studies using proper
scoring rules to elicit beliefs, however, found substantial improvements in fit (Nyarko
and Schotter 2002). As shown out by Rutstrom and Wilcox (2009), however, the act
of elicitation itself may well bias the learning dynamics. In contrast, direct extraction
of beliefs from neural activity presents the possibility of an unbiased measurement of
beliefs. More generally, neural data can discipline behavioral models of learning by
providing direct data regarding the causal mechanisms behind decision-making and
learning.
0/5000
จาก: -
เป็น: -
ผลลัพธ์ (ไทย) 1: [สำเนา]
คัดลอก!
3.2 การเรียนรู้ถึงแม้ว่าแบบจำลองข้างต้นขยายขอบเขตของแบบจำลองเศรษฐกิจแบบดั้งเดิมของตัดสินใจบริหารจัดการ จะ agnostic ในกระบวนการของการตลาดอาจเป้นการเข้าถึง ในทำนองเดียวกัน รวมโปรแกรมประยุกต์รุ่นเหล่านี้ยังสมมุติว่าสมดุลอย่างใดอย่างหนึ่งแล้ว หรือ ถ้ามีหลาย equilibriaเลือกสมดุลได้แล้วเกิดขึ้น ข้อมูลจากห้องปฏิบัติการทดลองอย่างไรก็ตาม แสดงรูปภาพเพิ่มเติมฉับ ในการทดลองมากที่สุด น้อยสำหรับ fewrounds แรก สังเกตลักษณะการทำงานอยู่ไกลจากสมดุล (ใด ๆ) (รอดและ Erev 1995Camerer 2003) หาก equilibration สมดุลถึงบางอย่างกระบวนการปรับให้เหมาะสมซ้ำ ซึ่งเราจะทำตามแผนการ และอ้างอิงถึงเป็นการเรียนรู้ทฤษฎีการเจริญเติบโตและเอกสารประกอบการทดลองเรียนรู้คำในเกมมีการตรวจสอบเมื่อและกลยุทธ์วิธีมาตรฐานในเกมคงอยู่ เน้นแตกต่างกันวิธีการเรียนรู้ วรรณคดีนี้ได้หลั่งน้ำตาแสงในบางประเด็นที่ยาวนานในแบบจำลองสมดุลของเกมไม่ใช่สหกรณ์3.2.1 เรียนและสมดุลตามที่อธิบายไว้ก่อนหน้านี้ เรียนได้วิธีการโดยเฉพาะประสบในการทำนายสมดุลที่จะถูกเลือกในเกมกับ equilibria แนชหลาย ในประเภทของเกมเป็นไปได้ เช่น หลายรูปแบบตามความเชื่อมาบรรจบกันเพื่อเป็นการเพิ่มสมดุล (Monderer และ Shapley 1996) รวมวิธีการเรียนรู้ตามความเชื่อคลาสสิกกับลักษณะทางสังคมของกลุ่มกองทัพเฉินเฉิน (2011) เสนอแบบจำลองทฤษฎีของเอกลักษณ์ทางสังคม และได้รับซึ่งตัวตนทางสังคมเปลี่ยนแปลงเลือกสมดุล โดยการเปลี่ยนเงื่อนไขการฟังก์ชันที่อาจเกิดขึ้น โดยเฉพาะ เมื่อคนรู้สึก altruistic มากต่อพวกเขาสมาชิก ingroup (เฉินและ Li 2009), พวกเขาจะออกแรงสมดุลความพยายามที่สูงขึ้นในความรู้สึกของการครอบงำแบบเฟ้นสุ่มลำดับแรกในเกมแรง การทดสอบความสามารถในรุ่นนี้การทำนายลักษณะการทำงานในห้องปฏิบัติการ ผู้ออกแบบการทดลองใช้เกมแรงของแวน Huyck et al. (1990) กับการกำหนดค่าพารามิเตอร์ที่เรียนรู้จะส่งผลให้บรรจบกันไปที่ต่ำ ความพยายามต่ำสมดุลขาดของกลุ่มตน (Goeree และโฮลต์ 2005) ในความใกล้น้อยที่สุดรักษา พวกเขาแสดงที่ตรงกับหัวเรื่อง ด้วย ingroup หรือ outgroup สมาชิกบางอย่างมีผลต่อระดับความพยายามเลือกที่จะไม่แตกต่างทางสถิติหรือไม่จากการควบคุม ที่มีเกิดกลุ่มไม่ บนมืออื่น ๆ เมื่อพวกเขาเพิ่มกลุ่ม โดยการอนุญาตให้การสื่อสารกับสมาชิกกลุ่มในการแก้งานง่าย ๆ ก่อนเล่นเกมแรง พวกเขาพบที่ตรงกันเรื่องสมาชิก ingroup มีผลบวกอย่างมีนัยสำคัญทางสถิติในการเรื่องการให้ความ ดังนั้น สอดคล้องกับรุ่น ingroup ตรงกันอย่างมีนัยสำคัญประสานงานเพิ่มขึ้นและมีประสิทธิภาพ เอกสารนี้จัดสรรไปที่ทฤษฎีรากฐานของเอกลักษณ์ทางสังคมโดยเห็นว่า โดยใช้ groupcontingent ง่ายรูปแบบกำหนดลักษณะสังคม จำเป็นต้อง endogenize บรรทัดฐานบ่อยในฉบับ Akerlof และ Kranton สังคมประจำรุ่น (2000, 2005) และกระทบกับจำนวนเกมประสานงานการทดลองค้นพบทฤษฎีผลลัพธ์ได้ผลทางปฏิบัติสำหรับการออกแบบองค์กร องค์กรมีเพิ่มเติมมักพบปัญหาของการรวมกลุ่มแรงงานต่าง ๆ และสร้างแรงจูงใจสมาชิกต่างมาเพื่อทำงานต่อเป้าหมายร่วมกันเฉินและเฉิน (2011) แสดงที่สร้างความลึกของข้อมูลประจำตัวทั่วไปจูงใจคนจะพยายามเพิ่มเติมถึงผลที่มีประสิทธิภาพมากขึ้น การประสบความสำเร็จของความคิดนี้มาจากเดอร์คิ (http://www.kiva.org/), การเกิดไมโครไฟแนนซ์ในยืมเว็บไซต์ การจัดสินเชื่อให้ผู้ประกอบการทั่วโลกสิงหาคม 2551 เดอร์คิเปิดตัวโปรแกรมของทีมให้ยืมที่จัดผู้ให้กู้เป็นทีมที่ใช้ประจำ ผู้ให้กู้ใด ๆ สามารถเข้าร่วมทีมตามโรงเรียนของเธอ ศาสนาที่ตั้งทางภูมิศาสตร์ กีฬา หรือเข้าสังกัดกลุ่มอื่น ๆ โปรแกรมทีมยืมเพิ่มขึ้นจำนวนเงินที่เพิ่มขึ้นอย่างมีนัยสำคัญ 3.2.2 ชีวภาพพื้นฐานการเรียนรู้ในหลายปฏิบัติการทดลอง ค้นหาทั่วไปคือ เกม nontrivialเล่นค่อย ๆ ถึงสมดุลเวลาผ่านบางขั้นตอนการปรับตัวโดยทั่วไปอ้างถึงเป็นการเรียนรู้ (Camerer 2003 บทที่ 6) หมายเลขรุ่นของเรียนรู้ในเกมได้รับการเสนอชื่อ เหล็กเสริมโดยเฉพาะอย่างยิ่ง ตามความเชื่อและรูปแบบ เป็นรุ่นไฮบริดเช่นประสบการณ์เที่ยวถ่วงน้ำหนัก (เอวา) (ดูCamerer และโฮจิมินห์ 1999 และโฮจิมินห์ et al. 2007)ซู et al. (2010) สร้างเอกสารประกอบการนี้ โดยศึกษากลไกประสาทต้นแบบเรียนรู้กลยุทธ์ที่ใช้ทำแม่เหล็กสั่นพ้องภาพ (fMRI) นี้เป็นการแข่งขันอาจประสบได้ประสาทกลไกการเรียนรู้จากการค้นพบชั้นของ neurons ได้แก่การโดพามีน neurons, revolutionizedที่จะใช้แบบความแตกต่างชั่วคราว (TD) การเรียนรู้เสริมสร้างมาจากจิตวิทยาพฤติกรรมและเครื่องเรียน literatures ของ TDเรียนรู้เป็นการคำนวณและการปรับปรุงมีรางวัลทายผลข้อผิดพลาด (RPE), โดยสิ่งมีชีวิต (ในกรณีนี้เล่น) เรียนรู้จากความขัดแย้งระหว่างสิ่งคาดว่าจะเกิดขึ้น และอะไรจะเกิดขึ้น (ซัตตั้นและ Barto 1981) นี้มีจำนวนเอกสารล่าสุดที่ implicating เช่นภูมิภาค dopaminergic ในตัดสินใจภายใต้ความเสี่ยง และความไม่แน่นอน (เช่น Fiorillo et al. 2003) ที่สำคัญจากมุมมองของกลยุทธ์เรียน เอกสารประกอบการนี้มีชุดของแบบเป็นชิ้นเป็นไปได้พฤติกรรมที่มีศักยภาพในการสังเกตพฤติกรรมของการเชื่อมต่อโดยตรงเรียน dynamics ในเกมบนมือหนึ่ง (รอดและ Erev 1995 Camerer 2003),และข้อสังเกตุประสาทของสมองเปลี่ยนแปลงอื่น ๆใช้ซู et al. (2010) เฉพาะรุ่น asymmetric ของเกมการแข่งขันสิทธิบัตรfirst studied experimentally in Rapoport and Amaldoss (2000), to search for regionsof the brain involved in computation of expected payoffs and prediction errors thatcan be used to guide behavior. The large strategy space of this game improves therecovery of key parameters in learning models relative to smaller games typicallyused in such studies (Wilcox 2006).Reinforcement and belief-based models were implemented in the manner consistentwith temporal difference models (Sutton and Barto 1981) and fitted to the neuraldata. The results show evidence of reinforcement and belief-based learning signals inthe manner predicted by EWA learning. Somewhat surprisingly, these distinct signalsare represented in both overlapping and distinct brain regions. There are a number ofpotential extensions to this study. First, despite the empirical success of the aforementionedmodels, the model fits are far from perfect. Belief-learning in particular, relies onstrong functional form assumptions regarding the construction of beliefs, which has longbeen assumed in standard models to be unobservable. Recent studies using properscoring rules to elicit beliefs, however, found substantial improvements in fit (Nyarkoand Schotter 2002). As shown out by Rutstrom and Wilcox (2009), however, the actof elicitation itself may well bias the learning dynamics. In contrast, direct extractionof beliefs from neural activity presents the possibility of an unbiased measurement ofbeliefs. More generally, neural data can discipline behavioral models of learning byproviding direct data regarding the causal mechanisms behind decision-making andlearning.
การแปล กรุณารอสักครู่..
ผลลัพธ์ (ไทย) 2:[สำเนา]
คัดลอก!
3.2
การเรียนรู้แม้ว่าแบบจำลองดังกล่าวข้างต้นขยายขอบเขตของแบบจำลองทางเศรษฐกิจแบบดั้งเดิมของการตัดสินใจในการบริหารจัดการที่พวกเขาจะไม่เชื่อเรื่องพระเจ้าในขั้นตอนของวิธีการตลาดอาจถึงความสมดุล ในทำนองเดียวกันการใช้งานเชิงประจักษ์ของโมเดลเหล่านี้ยังคิดว่าสมดุลได้รับการอย่างใดอย่างหนึ่งมาถึงแล้วหรือถ้ามีหลายสมดุล, การเลือกสมดุลได้ดำเนินการแล้วสถานที่ ข้อมูลจากการทดลองในห้องปฏิบัติการ, แต่แสดงภาพที่เหมาะสมยิ่งขึ้น ในการทดลองมากที่สุดอย่างน้อยสำหรับ fewrounds แรกพฤติกรรมที่เห็นอยู่ไกลจาก (ใด ๆ ) สมดุล (โรทและ Erev 1995; Camerer 2003) หากเกิดสมดุลสมดุลถึงผ่านกระบวนการปรับตัวซ้ำซึ่งเราจะติดตามการประชุมและหมายถึงการเรียนรู้. ทฤษฎีการเจริญเติบโตและการวิจัยวรรณคดีในการเรียนรู้ในการเล่นเกมมีการตรวจสอบเวลาและวิธีการกลยุทธ์ที่ไม่ได้มาตรฐานในการเล่นเกมยังคงมีอยู่ การมุ่งเน้นที่แตกต่างกันวิธีการของการเรียนรู้วรรณกรรมนี้ได้หลั่งน้ำตาแสงในบางประเด็นยาวนานในรูปแบบสมดุลของเกมที่ไม่ให้ความร่วมมือ. 3.2.1 การเรียนรู้และการเลือกสมดุลตามที่กล่าวไว้ก่อนหน้านี้ได้รับการเรียนรู้วิธีการที่มีผลเฉพาะอย่างยิ่งในการคาดการณ์ที่จะสมดุลได้รับการคัดเลือกในเกมกับสมดุลของแนชหลาย ในระดับของเกมที่อาจเกิดขึ้นตัวอย่างเช่นหลายความเชื่อที่ใช้รูปแบบการเรียนรู้ที่มาบรรจบกับความสมดุลเพิ่มศักยภาพ(Monderer และแชปลีย์ 1996) รวมวิธีการเรียนรู้ตามความเชื่อที่คลาสสิกที่มีการตั้งค่าทางสังคมกลุ่มผูกพันเฉินเฉิน(2011) นำเสนอรูปแบบทางทฤษฎีของตัวตนของสังคมและได้รับมาภายใต้เงื่อนไขที่เลือกเอกลักษณ์ทางสังคมมีการเปลี่ยนแปลงความสมดุลโดยการเปลี่ยนฟังก์ชั่นที่มีศักยภาพ โดยเฉพาะเมื่อมีคนเห็นแก่ผู้อื่นรู้สึกของพวกเขามากขึ้นต่อสมาชิกกลุ่มภายใน (เฉินและหลี่ 2009) พวกเขาจะออกแรงพยายามสมดุลที่สูงขึ้นในความรู้สึกของการปกครองสุ่มลำดับแรกในเกมความพยายามขั้นต่ำ เพื่อทดสอบความสามารถของรุ่นนี้ที่จะทำนายพฤติกรรมในห้องปฏิบัติการที่พวกเขาออกแบบการทดลองโดยใช้เกมความพยายามขั้นต่ำของVan Huyck et al, (1990) การกำหนดค่าพารามิเตอร์ที่มีที่เรียนรู้จะส่งผลให้การบรรจบกันจะไม่มีประสิทธิภาพต่ำพยายามสมดุลขาดของตัวตนของกลุ่ม(Goeree และโฮลท์ 2005) ในใกล้ที่น้อยที่สุดของพวกเขาการรักษาพวกเขาแสดงให้เห็นว่าในขณะที่ตรงกับวิชาที่มีสมาชิกกลุ่มภายในหรือ outgroup มีผลต่อระดับความพยายามที่เลือกพวกเขาจะไม่แตกต่างทางสถิติจากการควบคุมที่ไม่ได้รับการเหนี่ยวนำให้เกิดกลุ่ม ในทางกลับกันเมื่อพวกเขาเสริมสร้างกลุ่มโดยให้พวกเขาในการสื่อสารกับสมาชิกของกลุ่มในการแก้เป็นงานที่ง่ายก่อนที่จะเล่นเกมความพยายามขั้นต่ำ, พวกเขาพบว่าตรงกับวิชาที่มีสมาชิก ingroup มีผลบวกอย่างมีนัยสำคัญในเรื่องความพยายามให้. ดังนั้นที่สอดคล้องกับรูปแบบการจับคู่กลุ่มภายในอย่างมีนัยสำคัญเพิ่มการประสานงานและมีประสิทธิภาพ กระดาษนี้จะก่อให้เกิดทฤษฎีรากฐานของเอกลักษณ์ทางสังคมโดยการแสดงให้เห็นว่าโดยใช้ง่าย groupcontingent รูปแบบการตั้งค่าทางสังคมก็เป็นไปได้ที่จะ endogenize บรรทัดฐานภายนอกในAkerlof ต้นฉบับและ Kranton รุ่นเอกลักษณ์ทางสังคม (2000, 2005) และการเจรจาต่อรองทฤษฎีกับผลการทดลองในจำนวนของเกมการประสานงาน. ผลที่ได้ยังมีความหมายในทางปฏิบัติสำหรับการออกแบบองค์กร องค์กรจะบ่อยครั้งมากขึ้นเผชิญหน้ากับปัญหาของการบูรณาการแรงงานที่มีความหลากหลายและสมาชิกในการสร้างแรงจูงใจมาภูมิหลังที่แตกต่างกันในการทำงานไปสู่เป้าหมายร่วมกัน. เฉินและเฉิน (2011) แสดงให้เห็นว่าการสร้างความรู้สึกลึก ๆ ของตัวตนทั่วไปสามารถกระตุ้นให้คนที่จะใช้ความพยายามมากขึ้นในการเข้าถึงผลที่มีประสิทธิภาพมากขึ้น ที่ประสบความสำเร็จการประยุกต์ใช้ความคิดนี้มาจาก Kiva (http://www.kiva.org/) ซึ่งเป็นบุคคลต่อบุคคลที่เว็บไซต์ของการปล่อยสินเชื่อรายย่อยซึ่งจัดเงินให้กู้ยืมแก่ผู้ประกอบการทั่วโลก. ในเดือนสิงหาคมปี 2008 เปิดตัวทีม Kiva การให้กู้ยืมเงิน โปรแกรมที่จัดให้กู้เป็นทีมตัวตนตาม ผู้ให้กู้ใด ๆ ที่สามารถเข้าร่วมทีมที่ขึ้นอยู่กับโรงเรียนของเธอศาสนาที่ตั้งทางภูมิศาสตร์, กีฬา, หรือเกี่ยวพันกับกลุ่มอื่น โปรแกรมทีมการปล่อยสินเชื่ออย่างมีนัยสำคัญเพิ่มปริมาณของเงินทุนที่เพิ่มขึ้น. 3.2.2 พื้นฐานทางชีวภาพของการเรียนรู้ในการทดลองในห้องปฏิบัติการต่างๆ นานาการค้นพบทั่วไปคือว่าสำหรับเกมขี้ปะติ๋ว, ผู้เล่นค่อยๆถึงความสมดุลในช่วงเวลาที่ผ่านขั้นตอนของการปรับตัวบางเรียกโดยทั่วไปว่าการเรียนรู้ (Camerer 2003 บทที่ 6) จำนวนของรูปแบบของการเรียนรู้ในเกมที่ได้รับการเสนอเสริมโดยเฉพาะอย่างยิ่งและตามความเชื่อรูปแบบเช่นเดียวกับรุ่นไฮบริดเช่นสถานที่ถ่วงน้ำหนักประสบการณ์(EWA) (ดูCamerer โฮปี 1999 และโฮ et al. 2007). ฮ et al, . (2010) สร้างเมื่อวรรณกรรมนี้โดยการศึกษากลไกของระบบประสาทการเรียนรู้พื้นฐานการถ่ายภาพเชิงกลยุทธ์โดยใช้คลื่นสนามแม่เหล็ก(fMRI) นี้เป็นความพยายามที่มีผลที่อาจเกิดขึ้นในขณะที่กลไกของระบบประสาทของการเรียนรู้ที่ได้รับการปฏิวัติจากการค้นพบของชั้นของเซลล์คือเซลล์ประสาทโดปามีนที่ที่ปรากฏที่จะใช้ความแตกต่างชั่วคราว(TD) รูปแบบของการเรียนรู้เสริม. ที่ได้มาจากพฤติกรรมจิตวิทยาและเครื่องจักร วรรณกรรมการเรียนรู้ที่หลักของการ TD การเรียนรู้คือการคำนวณและการปรับปรุงข้อผิดพลาดการคาดการณ์ผลตอบแทน (RPE) โดยสิ่งมีชีวิต(ในการเล่นกรณีนี้) เรียนรู้จากความแตกต่างระหว่างสิ่งที่คาดหวังที่จะเกิดขึ้นและสิ่งที่เกิดขึ้นจริง(ซัตตันและ Barto 1981 ) ซึ่งรวมถึงจำนวนของเอกสารที่ผ่านมาส่งผล dopaminergic ภูมิภาคดังกล่าวในการตัดสินใจภายใต้ความเสี่ยงและความไม่แน่นอน(เช่น Fiorillo et al. 2003) ที่สำคัญจากมุมมองของการเรียนรู้เชิงกลยุทธ์วรรณกรรมนี้มีชุดรูปแบบที่เป็นทางการที่เป็นไปได้ทางชีวภาพของพฤติกรรมที่มีศักยภาพที่จะเชื่อมต่อโดยตรงสังเกตพฤติกรรมของการเปลี่ยนแปลงการเรียนรู้ในการเล่นเกมบนมือข้างหนึ่ง(โรทและ Erev 1995; Camerer 2003), และ สังเกตประสาทของการเปลี่ยนแปลงของสมองในที่อื่น ๆ . โดยเฉพาะฮ et al, (2010) ที่ใช้เป็นรุ่นที่ไม่สมมาตรของเกมการแข่งขันสิทธิบัตรครั้งแรกที่มีการศึกษาทดลองในRapoport และ Amaldoss (2000) เพื่อค้นหาภูมิภาคของสมองที่เกี่ยวข้องในการคำนวณผลตอบแทนที่คาดหวังและการคาดการณ์ข้อผิดพลาดที่สามารถนำมาใช้เพื่อเป็นแนวทางในพฤติกรรม พื้นที่กลยุทธ์ที่มีขนาดใหญ่ของเกมนี้ช่วยเพิ่มการฟื้นตัวของพารามิเตอร์ที่สำคัญในการเรียนรู้รูปแบบเทียบกับเกมที่มีขนาดเล็กมักจะใช้ในการศึกษาดังกล่าว(วิลคอกซ์ 2006). การเสริมแรงและรูปแบบความเชื่อตามที่ถูกนำมาใช้ในลักษณะที่สอดคล้องกับรูปแบบที่แตกต่างชั่วคราว (ซัตตันและ Barto 1981) และพอดีกับประสาทข้อมูล ผลที่ได้แสดงหลักฐานของการเสริมแรงและตามความเชื่อสัญญาณการเรียนรู้ในลักษณะที่คาดการณ์โดยการเรียนรู้ EWA ค่อนข้างน่าแปลกใจที่การส่งสัญญาณที่แตกต่างกันเหล่านี้จะแสดงทั้งในที่ทับซ้อนกันและภูมิภาคสมองที่แตกต่างกัน มีจำนวนเป็นส่วนขยายที่มีศักยภาพในการศึกษาครั้งนี้ ครั้งแรกแม้จะประสบความสำเร็จในการทดลองดังกล่าวข้างต้นของรูปแบบที่เหมาะกับรูปแบบการอยู่ห่างไกลจากความสมบูรณ์แบบ ความเชื่อการเรียนรู้โดยเฉพาะอย่างยิ่งต้องอาศัยสมมติฐานรูปแบบการทำงานที่เกี่ยวกับการก่อสร้างที่แข็งแกร่งของความเชื่อซึ่งได้ longbeen สันนิษฐานในรูปแบบมาตรฐานเพื่อจะสำรวจ การศึกษาล่าสุดที่เหมาะสมโดยใช้กฎการให้คะแนนที่จะล้วงเอาความเชื่อ แต่พบการปรับปรุงที่สำคัญในแบบ (Nyarko และ Schotter 2002) ดังที่แสดงโดย Rutstrom และวิลคอกซ์ (2009) แต่การกระทำของตัวเองดึงเอาดีอาจมีอคติการเปลี่ยนแปลงการเรียนรู้ ในทางตรงกันข้ามการสกัดโดยตรงของความเชื่อจากการดำเนินกิจกรรมของระบบประสาทที่มีการจัดเป็นไปได้ของการวัดที่เป็นกลางของความเชื่อ โดยทั่วไปข้อมูลประสาทสามารถมีวินัยในรูปแบบพฤติกรรมของการเรียนรู้โดยการให้ข้อมูลโดยตรงเกี่ยวกับกลไกสาเหตุที่อยู่เบื้องหลังการตัดสินใจและการเรียนรู้






























































































การแปล กรุณารอสักครู่..
ผลลัพธ์ (ไทย) 3:[สำเนา]
คัดลอก!
3.2 การเรียนรู้
ถึงแม้ว่ารูปแบบดังกล่าวข้างต้นขยายขอบเขตของรูปแบบเศรษฐกิจแบบดั้งเดิมของ
การตัดสินใจบริหาร พวกเขาไม่เชื่อในพระเจ้าในกระบวนการของวิธีการตลาดอาจ
ถึงสมดุล อนึ่ง งานเชิงประจักษ์ของรุ่นนี้ก็ถือว่ามีให้อยู่แล้ว
สมดุลถึง หรือถ้ามีหลายสมดุล สมดุล
เลือกได้ .ข้อมูลจากการทดลองในห้องปฏิบัติการ
แต่แสดงเพิ่มเติมโดยภาพ ในการทดลองมากที่สุด อย่างน้อยเพื่อ fewrounds แรก สังเกตพฤติกรรมที่ห่างไกลจาก ( ใด ๆ ) สมดุล ( Roth และ erev 1995 ;
camerer 2003 ) ถ้า equilibration เกิดขึ้นสมดุลถึงผ่านบาง
ซ้ำกระบวนการปรับตัว ซึ่งเราจะติดตามการประชุมและเรียกว่า การเรียนรู้
การเปรียบเทียบทฤษฎีและวรรณกรรมในการเรียนรู้ในเกมได้ตรวจสอบ
เมื่อและวิธีการมาตรฐานในเกมกลยุทธ์คงอยู่ มุ่งเน้นไปที่วิธีการที่แตกต่างกัน
การเรียนรู้วรรณคดีนี้หลั่งแสงในบางอันยาวนานในประเด็น
ตัวแบบดุลยภาพไม่ใช่เกมแบบร่วมมือ และการดำเนินงานของการเรียนรู้

ตามที่กล่าวไว้ก่อนหน้านี้การเรียนรู้มีวิธีการโดยเฉพาะอย่างยิ่งมีผลในการพยากรณ์
ที่สมดุลจะถูกเลือกในเกมกับหลายแนชสมดุล . ใน
คลาสของเกมที่มีศักยภาพตัวอย่างเช่นความเชื่อหลายฐานการเรียนรู้แบบบรรจบ
เพื่อศักยภาพสูงสุด ( และสมดุล monderer แชปลีย์ 1996 ) รวม
ความเชื่อคลาสสิกการเรียนรู้วิธีการกลุ่มผูกพันทางสังคม
ความชอบเฉิน และ เฉิน ( 2011 ) นำเสนอรูปแบบทางทฤษฎีอัตลักษณ์ทางสังคมและการสืบทอด
ภายใต้เงื่อนไขที่เปลี่ยนแปลงสถานะทางสังคมโดยการเปลี่ยนสมดุล การเลือกฟังก์ชัน
ที่มีศักยภาพ โดยเฉพาะ เมื่อคนรู้สึกเอื้อเฟื้อต่อสมาชิกกลุ่มของพวกเขา
( เฉินและหลี่ 2009 ) , พวกเขาจะออกแรงความพยายามสูงสมดุลใน
ความรู้สึกแรกสุ่มการปกครองในเกมความพยายามน้อยที่สุดเพื่อทดสอบความสามารถของรูปแบบนี้
ทำนายพฤติกรรมในห้องปฏิบัติการที่พวกเขาออกแบบการทดลอง
ใช้ความพยายามน้อยที่สุดเกมของ แวน huyck et al . ( 1990 ) กับพารามิเตอร์การกำหนดค่า
ที่การเรียนการสอนจะส่งผลให้ประสิทธิภาพต่ำเวอร์ , ความพยายาม
สมดุลขาดเอกลักษณ์ของกลุ่ม และ goeree โฮลท์ 2005 ) ในการรักษาของพวกเขาใกล้น้อยที่สุด
,พวกเขาแสดงให้เห็นว่าในขณะที่จับคู่กลุ่มตัวอย่างที่มีกลุ่มหรือสมาชิกกลุ่ม
มีผลบางอย่างในระดับที่พยายามเลือกพวกเขาเป็นอย่างมีนัยสำคัญที่แตกต่าง
จากการควบคุมที่ไม่มีกลุ่มจะเกิด บนมืออื่น ๆ เมื่อพวกเขา
เพิ่มกลุ่มโดยให้พวกเขาสามารถสื่อสารกับสมาชิกกลุ่มในการแก้ปัญหา
งานง่ายๆก่อนเล่นเกมความพยายามน้อยที่สุด พวกเขาพบว่า การจับคู่
ความสัมพันธ์กับสมาชิกในกลุ่มที่มีผลอย่างมีนัยสำคัญในเชิงบวกเกี่ยวกับ
วิชาให้ความพยายาม ซึ่งสอดคล้องกับรูปแบบของกลุ่มเพิ่มขึ้นอย่างมีนัยสำคัญ
จับคู่ประสานงานและประสิทธิภาพ กระดาษนี้ก่อให้เกิดรากฐานทางทฤษฎี
อัตลักษณ์ทางสังคม โดยแสดง โดยใช้การวิ groupcontingent
สังคมการตั้งค่ารูปแบบมันเป็นไปได้ที่จะ endogenize บรรทัดฐานจากภายนอก
ในต้นฉบับ เ คอร์ลอฟและเอกลักษณ์ทางสังคม kranton รุ่น ( 2000 , 2005 ) และ

ง้อทฤษฎีกับการทดลองใช้ในหลายประสานงานเกม .
ผลยังมีผลกระทบในทางปฏิบัติสำหรับการออกแบบองค์กร องค์กร
บ่อยพบปัญหาของการบูรณาการบุคลากรหลากหลายและ
การกระตุ้นสมาชิกมาหลังที่แตกต่างกันทำงานไปสู่เป้าหมายร่วมกัน
เฉินและเฉิน ( 2011 ) แสดงให้เห็นว่า การสร้างความรู้สึกลึกของตัวตนทั่วไปสามารถ
กระตุ้นให้ผู้คนใช้ความพยายามมากขึ้นเพื่อเข้าถึงผลมีประสิทธิภาพมากขึ้น โปรแกรมที่ประสบความสำเร็จ
ของความคิดนี้มาจากคิบะ ( http : / / www.kiva . org / ) , มีคนยืม
บริการเว็บไซต์ซึ่งจัดสินเชื่อเพื่อผู้ประกอบการทั่วโลก .
ในเดือนสิงหาคม 2008 , คิบะเปิดตัวโปรแกรมซึ่งจัดทีมสินเชื่อตลอดจน
ในตัวตน โดยทีม ใด ๆที่ผู้ให้กู้สามารถเข้าร่วมทีมตามโรงเรียนของเธอ , ศาสนา ,
สถานที่ , กีฬาทางภูมิศาสตร์ หรือกลุ่มอื่น ๆ ปัจจุบัน ทีมให้ยืมโปรแกรม
มีผลในการเพิ่มปริมาณของเงินขึ้นมา 3.2.2 แท้ๆ


พื้นฐานของการเรียนรู้ในการทดลองในห้องปฏิบัติการมากมาย พบทั่วไปคือว่าเกมนอนทริเวียล
ผู้เล่นค่อยๆเข้าถึง , สมดุลตลอดเวลา ผ่านกระบวนการของการปรับตัว
โดยปกติหมายถึงการเรียนรู้ ( camerer 2003 บทที่ 6 ) หมายเลขรุ่นของ
การเรียนรู้ในเกมที่ได้รับการเสนอโดยการเสริมแรงและความเชื่อตาม
รุ่นเช่นเดียวกับรุ่นไฮบริด เช่น ประสบการณ์เที่ยวหนัก ( อีวา ) ( ดู
camerer โฮ 1999 และโฮ et al . 2007 ) .
Hsu et al . ( 2010 ) สร้างเมื่อวรรณกรรมนี้โดยศึกษากลไกพื้นฐานการเรียนรู้โดยใช้ประสาท
ยุทธศาสตร์การทำงานภาพแม่เหล็ก ( fMRI ) นี้เป็นความพยายามที่อาจมีผล
เป็นกลไกประสาทของการเรียนรู้ได้
การปฏิวัติจากการค้นพบของชั้นเรียนของเซลล์ประสาท คือ โดปามีน ประสาท ,
ที่ปรากฏที่จะใช้ความแตกต่างชั่วคราว ( TD ) รูปแบบของการเรียนรู้แบบเสริมกำลัง .
มาจากจิตวิทยาพฤติกรรมและการเรียนรู้เครื่องวรรณกรรม ในหลักของ TD
การเรียนรู้คือการคำนวณและปรับปรุงรางวัลทำนายผิดพลาด ( RPE
) โดย
การแปล กรุณารอสักครู่..
 
ภาษาอื่น ๆ
การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.

Copyright ©2025 I Love Translation. All reserved.

E-mail: