The arousal-mediated learning model provided an adequate description of CS+/CS− maintenance, extinction, and reversal performance (Experiment 1), and accurately predicted performance of a different group of rats exposed to periodic CS+/CS− reversals (Experiment 2). The model adjusts the Rescorla-Wagner linear operator by letting the US-dependent rate parameter (Rescorla and Wagner, 1972, called it β–we call it arousal, or A) vary with US density. The model also allows for arousal to be conditioned to the context. These adjustments are minor in size, but have significant consequences. If arousal varies faster than conditioning, the model accounts for the extinction of conditioned responding as mainly a reduction in arousal, not in conditioning. By preserving conditioning during extinction, the model also accounts for rapid reacquisition, renewal, and reinstatement effects. Moreover, by incorporating the notions of arousal and persistent response state, the model advances the Rescorla-Wagner intuitions toward an account of learning and performance, not just learning.
There is a clear analogy between the arousal-mediated learning model and other classic models derived from the Rescorla-Wagner linear operator. Whereas Rescorla and Wagner (1972) assumed that US- and CS-dependent learning rates were constant, Mackintosh (1975) and Pearce and Hall (1980) suggested that the CS-dependent rate varied with the amount of attention allocated to the CS, which presumably varies with conditioning. Although the sort of variations in CS-dependent rate suggested by the Mackintosh and Pearce-Hall models cannot account for reacquisition effects the way changes in arousal do, there is no inherent reason why attentional processes cannot be incorporated into the arousal-mediated model, modulating changes in αV and βV (Equation (2)), which are currently constant. Conversely, as animals may pay more attention to their environment when highly aroused, the present formalism may accommodate those data.
Killeen et al. (2009) suggested a dynamic model of conditioning and extinction similar to the arousal-mediated learning model advanced here, but without the arousal component. In their Experiment 1, when rate of reinforcement varied across conditions, parameter estimates changed; in their Experiment 2, when rate of reinforcement was constant (only the CS duration varied) parameter estimates remained constant. It thus appears that parameter invariance across conditions in their Experiment 1 might have been achieved by incorporating arousal into Killeen et al.’s model. The notions of response perseverance and random responding within response states in the arousal-mediated learning model are directly borrowed from Killeen et al.’s model.
The arousal-mediated learning model is not without limitations. In particular, we mentioned the collinearity of the rates of arousal and conditioning acquisition and that the model failed to predict changes in performance over repeated training conditions. Moreover, the arousal-mediated learning model also cannot account for the resurgence of extinguished performance such as that reported by Lindblom and Jenkins (1981). In their experiment, a conditioned response was extinguished by presenting the US either randomly or only in the absence of the CS. When the US was no longer presented in the final condition, conditioned responding resurged. Contrary to these findings, the arousal-mediated learning model predicts that non-contingent presentation of the US should have more effectively trained the CS-no US association and therefore no resurgence should be expected.
Another important limitation is that the model cannot account for some well-established extinction effects. It cannot account for the faster extinction of conditioned responses following continuous rather than partial reinforcement (Haselgrove et al., 2004). This is because extinction rate, according to the model, rapidly converges to 1 − βA within a few trials,4 and nothing in the model indicates that βA should be sensitive to training conditions. For this reason, the model also cannot account for data supporting behavioral momentum theory (see Nevin, 1992 and Nevin and Grace, 2000, for reviews), in which operant responding is more resistant within and across successive sessions of extinction in discriminative stimulus contexts presenting higher rates of reinforcement (Nevin and Grace, 2005). For instance, Nevin et al. (1990) arranged a multiple schedule in which equal rates of food reinforcement were presented for pigeons keypecking in two components. Additional food was presented independent of keypecking in one component, degrading the operant contingency but enhancing the Pavlovian contingency—and arousal. Because resistance to disruption by satiation and extinction was greater in the component with added food, Nevin et al. suggested that Pavlovian, not operant, contingencies primarily govern the persistence of operant behavior.
Recently, Podlesnik and Shahan, 2009 and Podlesnik and Shahan, 2010 showed that, like resistance to disruption, relapse of discriminated operant behavior in resurgence, reinstatement, and renewal procedures also are governed by Pavlovian contingencies. Consistent with Bouton, 1993 and Bouton, 2004 interference framework, Podlesnik and Shahan attributed the greater relapse in richer contexts to the differential Pavlovian relations surviving extinction and their subsequent re-establishment. However, the Pavlovian relations between reinforcement and discriminative stimulus contexts influencing these effects also have been described as “non-specific effects that arouse or modulate behavior” (Nevin et al., 1990, p. 374) in a way analogous to a “central motive state” proposed by Bindra (1972) and Rescorla and Solomon (1967). This provides conceptual support for the notion that arousal plays a role in mediating differences in extinction and relapse of complex operant performance. Further theoretical development, perhaps by borrowing ideas from behavioral momentum theory, would result in the model accounting for such training effects (see also Killeen, 1998).
The interference hypothesis of extinction (Bouton, 1993 and Bouton, 2004) is likely to account for some of the limitations of the arousal-mediated learning model. The price of such account, however, is the reduced precision that is inherent to qualitative relative to quantitative learning models. The challenge for learning researchers is to mathematize the intuitions provided by the interference hypothesis. Whether such intuitions may be reduced to arousal processes is yet to be determined by further research. It is also yet unclear whether neural network models such as those proposed by Burgos and Murillo-Rodriguez (2007), Kehoe (1988), and Larrauri and Schmajuk (2008) can overcome the limitations of the arousal-mediated learning model. In the meantime, it appears that a productive route to advance learning theory is to further develop models that yield closed-form expressions to describe conditioning and extinction effects, thus balancing precision with simplicity. We hope that the arousal-mediated learning model will serve as launch pad for such developments.
รูปแบบการเรียนรู้ตื่นตัว-mediated ที่ให้คำอธิบายที่เพียงพอของ cs / CS-บำรุงรักษาการสูญเสียและประสิทธิภาพการโอนกลับรายการ (การทดลองที่ 1) และถูกต้องคาดการณ์ผลการดำเนินงานของกลุ่มที่แตกต่างกันของหนูสัมผัสกับระยะ cs / cs พลิกผัน (การทดลองที่ 2) รูปแบบการปรับ Rescorla-Wagner ดำเนินการเชิงเส้นโดยให้อัตราพารามิเตอร์ขึ้นอยู่กับเรา (Rescorla และแว็กเนอร์, 1972,เรียกมันว่าβ-เรามีความหนาแน่นเรียกว่าเร้าอารมณ์หรือ) แตกต่างกันไปกับเรา รุ่นนี้ยังช่วยให้สำหรับความตื่นตัวที่จะได้รับเงื่อนไขที่ทำให้บริบท การปรับเปลี่ยนเหล่านี้เป็นผู้เยาว์ในขนาด แต่มีผลกระทบอย่างมีนัยสำคัญ ถ้าความตื่นตัวแตกต่างกันไปได้เร็วกว่าเครื่องปรับอากาศบัญชีแบบจำลองสำหรับการสูญเสียของการตอบสนองปรับอากาศเป็นส่วนใหญ่ในการลดความตื่นตัวไม่ได้อยู่ในเครื่องโดยรักษาเครื่องในระหว่างการสูญเสียรูปแบบยังบัญชีสำหรับซื้อคืนอย่างรวดเร็วต่ออายุและผลกระทบสถานะ ยิ่งไปกว่านั้นโดยผสมผสานความคิดจากความตื่นตัวของรัฐและการตอบสนองถาวรก้าวหน้าแบบสัญชาติญาณ Rescorla-Wagner ไปในบัญชีของการเรียนรู้และผลการดำเนินงานไม่เพียง แต่การเรียนรู้.
มีการเปรียบเทียบที่ชัดเจนระหว่างการเรียนรู้แบบพึ่งตื่นตัวและรูปแบบคลาสสิกอื่น ๆ ที่ได้มาจาก Rescorla-Wagner ดำเนินการเชิงเส้นคือ ในขณะที่ Rescorla และแว็กเนอร์ (1972) สันนิษฐานว่าเราและ cs ขึ้นอยู่กับอัตราการเรียนรู้อย่างต่อเนื่องเป็นเสื้อกันฝน (1975) และ Pearce และฮอลล์ (1980) ชี้ให้เห็นว่าอัตรา CS-ขึ้นอยู่กับจำนวนเงินที่แตกต่างกันของความสนใจที่จัดสรรให้กับ cs,ซึ่งน่าจะแตกต่างกันไปด้วยเครื่อง แม้ว่าการจัดเรียงของการเปลี่ยนแปลงในอัตรา cs ขึ้นอยู่กับการแนะนำโดยฝนและรูปแบบ Pearce-ฮอลล์ไม่สามารถบัญชีสำหรับผลกระทบซื้อคืนมีการเปลี่ยนแปลงวิธีการเร้าอารมณ์ทางทำไม่มีเหตุผลโดยธรรมชาติทำไมกระบวนการตั้งใจจะไม่สามารถรวมเข้ากับรูปแบบความตื่นตัวพึ่งเลตคือ การเปลี่ยนแปลงในαvและβv (สมการ (2))ซึ่งมีอยู่ในปัจจุบันอย่างต่อเนื่อง ตรงกันข้ามเป็นสัตว์ที่อาจให้ความสำคัญกับสภาพแวดล้อมของพวกเขาเมื่อกระตุ้นความสูงเป็นพิธีในปัจจุบันอาจรองรับข้อมูลเหล่านั้น.
คิลลีน, et al (2009) เสนอแนะรูปแบบแบบไดนามิกของเครื่องและการสูญเสียที่คล้ายกันกับรูปแบบการเรียนรู้ตื่นตัวพึ่งก้าวที่นี่ แต่ไม่มีองค์ประกอบที่เร้าอารมณ์ ในการทดลองของพวกเขา 1เมื่ออัตราของการเสริมแรงที่แตกต่างกันทั่วเงื่อนไขพารามิเตอร์ประมาณการการเปลี่ยนแปลงในการทดลองที่ 2 ของพวกเขาเมื่ออัตราการเสริมแรงคงที่ (เฉพาะในช่วงระยะเวลาที่แตกต่างกัน cs) ประมาณการพารามิเตอร์ยังคงไม่เปลี่ยนแปลง มันจึงปรากฏว่าไม่แปรเปลี่ยนพารามิเตอร์ข้ามเงื่อนไขในการทดลองของพวกเขา 1 อาจจะได้รับประสบความสำเร็จโดยผสมผสานความตื่นตัวในคิลลีน, et al. แบบจำลองพัฒนาการของความเพียรการตอบสนองและการตอบสนองแบบสุ่มภายในรัฐตอบสนองในรูปแบบการเรียนรู้ที่เร้าอารมณ์ทางสื่อกลางที่ยืมมาโดยตรงจากรูปแบบคิลลีน, et al. 's.
รูปแบบการเรียนรู้ตื่นตัวพึ่งไม่ได้โดยไม่มีข้อ จำกัด โดยเฉพาะอย่างยิ่งเรากล่าวถึง collinearity จากอัตราการตื่นตัวและการซื้อเครื่องและรุ่นที่ล้มเหลวในการคาดการณ์การเปลี่ยนแปลงในการทำงานกว่าซ้ำเงื่อนไขการฝึกอบรม นอกจากนี้รูปแบบการเรียนรู้ตื่นตัว-mediated ที่ยังไม่สามารถบัญชีสำหรับการฟื้นตัวของผลการดำเนินงานดับเช่นที่รายงานโดย Lindblom และเจนกินส์ (1981) ในการทดลองของพวกเขาการตอบสนองปรับอากาศก็ดับโดยนำเสนอเราอย่างใดอย่างหนึ่งแบบสุ่มหรือเป็นเพียงในกรณีที่ไม่มี cs เมื่อเราถูกนำเสนอไม่ได้อยู่ในสภาพสุดท้ายปรับอากาศตอบสนอง resurged ตรงกันข้ามกับการค้นพบเหล่านี้รูปแบบการเรียนรู้ตื่นตัว-mediated ที่คาดการณ์ว่าการนำเสนอที่ไม่ได้เกิดขึ้นโดยบังเอิญของเราควรจะได้รับการฝึกฝนให้มีประสิทธิภาพมากขึ้น CS-ไม่มีเราสมาคมและดังนั้นการฟื้นตัวไม่ควรจะคาดหวัง.
อีกข้อ จำกัด ที่สำคัญคือรูปแบบไม่สามารถบัญชีสำหรับบางคนการสูญเสียที่ดีขึ้น ผลกระทบมันไม่สามารถบัญชีสำหรับการสูญเสียได้เร็วขึ้นของการตอบสนองต่อการเสริมสร้างความต่อเนื่องมากกว่าบางส่วน (haselgrove et al. 2004) นี้เป็นเพราะอัตราการสูญเสียเป็นไปตามรูปแบบที่ลู่ไปอย่างรวดเร็ว 1 - βaการทดลองภายในไม่กี่, 4 และไม่มีอะไรในรูปแบบที่แสดงให้เห็นว่าβaควรจะมีความไวต่อเงื่อนไขการฝึกอบรม เพราะเหตุนี้แบบยังไม่สามารถบัญชีสำหรับข้อมูลสนับสนุนทฤษฎีแรงผลักดันพฤติกรรม (ดู Nevin, 1992 และ Nevin และความสง่างาม, 2000, สำหรับความคิดเห็น) ซึ่งในการผ่าตัดการตอบสนองสามารถทนอยู่ภายในและระหว่างช่วงต่อเนื่องของการสูญเสียในบริบทที่กระตุ้นจำแนกมีการนำเสนออัตราที่สูงขึ้นของการเสริมแรง (Nevin และความสง่างาม, 2005) ตัวอย่างเช่น Nevin et al,(1990) จัดตารางเวลาหลายในอัตราที่เท่ากันของเหล็กเสริมอาหารที่มีการนำเสนอสำหรับนกพิราบ keypecking ในสองส่วน อาหารเสริมที่ถูกนำเสนอเป็นอิสระจาก keypecking หนึ่งในองค์ประกอบย่อยสลายฉุกเฉินผ่าตัด แต่การเสริมสร้างฉุกเฉินและ Pavlovian ความตื่นตัวเพราะความต้านทานต่อการหยุดชะงักโดยการป้อยอและการสูญเสียมากขึ้นในการเป็นส่วนประกอบกับอาหารเสริม Nevin et al, ชี้ให้เห็นว่า Pavlovian ไม่ผ่าตัดภาระผูกพันเป็นหลักควบคุมการคงอยู่ของพฤติกรรมผ่าตัด.
เมื่อเร็ว ๆ นี้ podlesnik และ shahan, 2009 และ podlesnik และ shahan, 2010 แสดงให้เห็นว่าเหมือนความต้านทานต่อการหยุดชะงักการกำเริบของพฤติกรรมผ่าตัดเลือกปฏิบัติในการฟื้นฟู,ขั้นตอนการคืนสิทธิและต่ออายุยังถูกควบคุมโดย Pavlovian ภาระผูกพัน สอดคล้องกับ Bouton, 1993 และ Bouton กรอบการแทรกแซง 2004, podlesnik และ shahan ประกอบการกำเริบของโรคมากขึ้นในบริบทยิ่งขึ้นเพื่อความสัมพันธ์ที่ Pavlovian ที่แตกต่างกันการสูญเสียชีวิตและสร้างใหม่ของพวกเขาในภายหลัง อย่างไรก็ตามความสัมพันธ์ระหว่างการเสริมแรง Pavlovian และบริบทที่มีอิทธิพลต่อการกระตุ้นจำแนกมีผลกระทบเหล่านี้ยังได้รับการอธิบายว่าเป็น "ผลกระทบที่ไม่เฉพาะเจาะจงที่กระตุ้นหรือปรับเปลี่ยนพฤติกรรม" (Nevin, et al., 1990, p. 374) ในทางที่คล้ายกับแรงจูงใจของรัฐ "กลาง "เสนอโดย Bindra (1972) และ Rescorla และซาโลมอน (1967)นี้ให้การสนับสนุนแนวคิดสำหรับความคิดที่ว่าความตื่นตัวมีบทบาทในการเป็นสื่อกลางความแตกต่างในการสูญเสียและการกำเริบของโรคจากการทำงานผ่าตัดที่ซับซ้อน ต่อการพัฒนาทางทฤษฎีอาจจะโดยการยืมความคิดจากทฤษฎีแรงผลักดันพฤติกรรมจะส่งผลให้รูปแบบการบัญชีสำหรับผลการฝึกอบรมดังกล่าว (เห็นคิลลีน, 1998).
สมมติฐานการรบกวนต่อการสูญพันธุ์ (Bouton,ปี 1993 และ Bouton, 2004) มีแนวโน้มที่จะบัญชีสำหรับบางส่วนของข้อ จำกัด ของรูปแบบการเรียนรู้แบบพึ่งตื่นตัว ราคาของบัญชีดังกล่าวก็คือความแม่นยำที่ลดลงซึ่งมีอยู่ญาติคุณภาพรูปแบบการเรียนรู้เชิงปริมาณ ความท้าทายสำหรับนักวิจัยการเรียนรู้คือการ mathematize สัญชาติญาณที่มีให้โดยสมมติฐานการรบกวนไม่ว่าจะเป็นสัญชาติญาณดังกล่าวอาจจะลดความตื่นตัวเป็นกระบวนการที่ยังไม่ถูกกำหนดโดยการวิจัยต่อไป ก็ยังยังไม่มีความชัดเจนว่ารูปแบบเครือข่ายระบบประสาทเช่นที่เสนอโดยกอสและ Murillo-Rodriguez (2007), Kehoe (1988) และ larrauri และ schmajuk (2008) สามารถเอาชนะข้อ จำกัด ของรูปแบบการเรียนรู้แบบพึ่งตื่นตัว ในขณะเดียวกันปรากฏว่าเป็นเส้นทางที่มีประสิทธิผลเพื่อความก้าวหน้าของการเรียนรู้ทฤษฎีคือการพัฒนารูปแบบที่ให้ผลการแสดงออกปิดแบบฟอร์มเพื่ออธิบายปรับอากาศและผลกระทบการสูญเสียความสมดุลจึงมีความแม่นยำด้วยความเรียบง่าย เราหวังว่ารูปแบบการเรียนรู้ตื่นตัวพึ่งจะทำหน้าที่เป็นเปิดตัวแพดสำหรับการพัฒนาดังกล่าว.
การแปล กรุณารอสักครู่..