Skinner found that the type of reinforcement which produces the slowest rate of extinction (i.e. people will go on repeating the behavior for the longest time without reinforcement) is variable-ratio reinforcement. The type of reinforcement which has the quickest rate of extinction is continuous reinforcement.
(A) Continuous Reinforcement
An animal/human is positively reinforced every time a specific behaviour occurs, e.g. every time a lever is pressed a pellet is delivered and then food delivery is shut off.
Response rate is SLOW
Extinction rate is FAST
(B) Fixed Ratio Reinforcement
Behavior is reinforced only after the behavior occurs a specified number of times. E.g. one reinforcement is given after every so many correct responses, e.g. after every 5th response. For example a child receives a star for every five words spelt correctly.
Response rate is FAST
Extinction rate is MEDIUM
(C) Fixed Interval Reinforcement
One reinforcement is given after a fixed time interval providing at least one correct response has been made. An example is being paid by the hour. Another example would be every 15 minutes (half hour, hour, etc.) a pellet is delivered (providing at least one lever press has been made) then food delivery is shut off.
Response rate is MEDIUM
Extinction rate is MEDIUM
(D) Variable Ratio Reinforcement
Behavior is reinforced after an unpredictable number of times. For examples gambling or fishing.
Response rate is FAST
Extinction rate is SLOW (very hard to extinguish because of unpredictability )
(E) Variable Interval Reinforcement
Providing one correct response has been made, reinforcement is given after an unpredictable amount of time has passed, e.g. on average every 5 minutes. An example is a self-employed person being paid at unpredictable times.
Response rate is FAST
Extinction rate is SLOW
Behavior Shaping
A further important contribution made by Skinner (1951) is the notion of behaviour shaping through successive approximation. Skinner argues that the principles of operant conditioning can be used to produce extremely complex behaviour if rewards and punishments are delivered in such a way as to encourage move an organism closer and closer to the desired behaviour each time.
In order to do this, the conditions (or contingencies) required to receive the reward should shift each time the organism moves a step closer to the desired behaviour.
According to Skinner, most animal and human behaviour (including language) can be explained as a product of this type of successive approximation.
Behavior Modification
Behavior modification is a set of therapies / techniques based on operant conditioning (Skinner, 1938, 1953). The main principle comprises changing environmental events that are related to a person's behavior. For example, the reinforcement of desired behaviors and ignoring or punishing undesired ones.
This is not as simple as it sounds — always reinforcing desired behavior, for example, is basically bribery.
There are different types of positive reinforcements. Primary reinforcement is when a reward strengths a behavior by itself. Secondary reinforcement is when something strengthens a behavior because it leads to a primary reinforcer.
Examples of behavior modification therapy include token economy and behavior shaping
Token Economy
Token economy is a system in which targeted behaviors are reinforced with tokens (secondary reinforcers) and later exchanged for rewards (primary reinforcers).
Tokens can be in the form of fake money, buttons, poker chips, stickers, etc. While the rewards can range anywhere from snacks to privileges or activities.
Token economy has been found to be very effective in managing psychiatric patients. However, the patients can become over reliant on the tokens, making it difficult for them to adjust to society once they leave prisons, hospital etc.
Teachers also use token economy at primary school by giving young children stickers to reward good behavior.
Operant Conditioning in the Classroom
In the conventional learning situation operant conditioning applies largely to issues of class and student management, rather than to learning content. It is very relevant to shaping skill performance.
A simple way to shape behavior is to provide feedback on learner performance, e.g. compliments, approval, encouragement, and affirmation. A variable-ratio produces the highest response rate for students learning a new task, whereby initially reinforcement (e.g. praise) occurs at frequent intervals, and as the performance improves reinforcement occurs less frequently, until eventually only exceptional outcomes are reinforced.
For example, if a teacher wanted to encourage students to answer questions in class they should praise them for every attempt (regardless of whether their answer is correct). Gradually the teacher will only praise the students when their answer is correct, and over time only exceptional answers will be praised.
Unwanted behavior
สกินเนอร์พบว่าประเภทของการเสริมแรง ซึ่งก่อให้เกิดอัตราที่ช้าที่สุดของการสูญเสีย ( เช่นคนที่จะทำซ้ำพฤติกรรมสำหรับเวลาที่ยาวที่สุดโดยไม่ต้องเสริมแรง ) คืออัตราส่วนของตัวแปร ประเภทของการเสริมแรง ซึ่งมีอัตราที่รวดเร็วของการสูญพันธุ์คือการเสริมแรงแบบต่อเนื่อง( 1 ) เสริมอย่างต่อเนื่องสัตว์ / มนุษย์ บวกเสริมทุกครั้งที่มีพฤติกรรมเฉพาะเกิดขึ้น เช่น ทุกครั้งที่มีคันโยกกดเม็ดจะถูกส่งและบริการส่งอาหารเป็นปิดอัตราการตอบสนองช้าอัตราการสูญพันธุ์อย่างรวดเร็ว( ข ) ที่มีอัตราส่วนคงที่พฤติกรรมเสริมแรงพฤติกรรมที่เกิดขึ้นหลังจากจำนวนที่ระบุเวลา เช่น ตัวเสริมให้หลังทุกมากถูกต้องตอบสนอง เช่น ทุกๆ 5 ตอบกลับ ตัวอย่างเช่นเด็กได้รับดาวทุกห้าคำที่สะกดถูกต้องอัตราการตอบสนองได้อย่างรวดเร็วอัตราการสูญพันธุ์ขนาดกลาง( c ) เสริมช่วงเวลาคงที่หนึ่งจะได้รับการเสริมแรงหลังจากช่วงเวลาคงที่ให้อย่างน้อยหนึ่งถูกต้องตอบสนองได้ด้วย ตัวอย่างการจ่ายเงินตามชั่วโมง อีกตัวอย่างหนึ่งคือทุก 15 นาที ( ครึ่ง , ชั่วโมง , ฯลฯ ) เม็ด ส่ง ( ให้อย่างน้อยหนึ่งก้านกดได้ ) จากนั้นบริการอาหารเป็นปิดอัตราการตอบสนองขนาดกลางอัตราการสูญพันธุ์ขนาดกลาง( D ) อัตราส่วนตัวแปรเสริมพฤติกรรมเสริมแรงหลังจากตัวเลขที่ไม่แน่นอนของครั้ง สำหรับตัวอย่างการพนัน หรือตกปลาอัตราการตอบสนองได้อย่างรวดเร็วอัตราการสูญเสียช้ามาก ( ยากที่จะดับเนื่องจาก unpredictability )( E ) เสริมช่วงตัวแปรหนึ่งในการตอบสนองให้ถูกต้องได้ เสริมให้ตามจำนวนที่ไม่แน่นอนของเวลาที่ผ่านไป เช่น เฉลี่ยทุก 5 นาที ตัวอย่างเป็นผู้ประกอบอาชีพการจ่ายเงินที่คาดเดาไม่ได้ครั้งอัตราการตอบสนองได้อย่างรวดเร็วอัตราการสูญพันธุ์เป็นช้าลักษณะรูปร่างเพิ่มเติมที่สำคัญผลงานที่ทำโดยสกินเนอร์ ( 2494 ) คือ ความคิด พฤติกรรมการสร้างผ่านต่อเนื่องประมาณ สกินเนอร์ระบุว่าหลักการของการเรียนรู้กลุ่มพฤติกรรมนิยมสามารถใช้ผลิตพฤติกรรมที่ซับซ้อนมากถ้ารางวัลและการลงโทษจะถูกส่งในลักษณะที่สนับสนุนให้ย้ายสิ่งมีชีวิตที่ใกล้ชิดและใกล้ชิดกับพฤติกรรมที่ต้องการในแต่ละครั้งเพื่อที่จะทำนี้ , เงื่อนไข ( หรือภาระผูกพัน ) ต้องได้รับรางวัล ควรกะเวลาแต่ละสิ่งมีชีวิตเคลื่อนเข้ามาใกล้ตามพฤติกรรมตามสกินเนอร์ , สัตว์มากที่สุด และพฤติกรรมของมนุษย์ ( รวมทั้งภาษา ) สามารถอธิบายเป็นผลิตภัณฑ์ต่อเนื่องของการประมาณค่าชนิดนี้การปรับพฤติกรรมการปรับเปลี่ยนพฤติกรรมเป็นชุดของการรักษา / เทคนิคตามการเรียนรู้กลุ่มพฤติกรรมนิยม ( สกินเนอร์ , 2481 , 1953 ) หลักการหลักมีการเปลี่ยนแปลงกิจกรรมด้านสิ่งแวดล้อมที่เกี่ยวข้องกับพฤติกรรมของบุคคล ตัวอย่างเช่น การเสริมแรงพฤติกรรมที่ต้องการและไม่สนใจหรือลงโทษที่ไม่พึงประสงค์ที่นี้ไม่ได้เป็นง่ายๆเป็นเสียง - เสมอการเสริมแรงพฤติกรรมที่พึงประสงค์ เช่น โดยทั่วไปการติดสินบนมีชนิดที่แตกต่างกันของเสริมบวก เมื่อรางวัลจุดแข็งหลักการเสริมแรงพฤติกรรมตัวเอง เสริมรองคือ เมื่อสิ่งที่เสริมสร้างพฤติกรรม เพราะจะทำให้ reinforcer หลักตัวอย่างของการรักษาด้วยการปรับเปลี่ยนพฤติกรรม รวมถึงเศรษฐกิจและพฤติกรรมการโทเค็นเศรษฐกิจของโทเค็นเศรษฐกิจ ซึ่งเป็นระบบที่เสริมด้วยพฤติกรรมเป้าหมายเป็นสัญญาณ ( reinforcers มัธยม ) และต่อมาเปลี่ยนเป็นรางวัล ( reinforcers หลัก )สัญญาณสามารถในรูปแบบของเงินปลอมปุ่มชิปโป๊กเกอร์ , สติกเกอร์ ฯลฯ ในขณะที่รางวัลสามารถช่วงใดก็ได้จากอาหารว่างเพื่อสิทธิพิเศษหรือกิจกรรมเศรษฐกิจของโทเค็นที่ได้รับพบว่ามีประสิทธิภาพมากในการจัดการผู้ป่วยจิตเวช อย่างไรก็ตาม ผู้ป่วยจะกลายเป็นมากกว่าพึ่งพาสัญญาณที่ทำให้มันยากสำหรับพวกเขาที่จะปรับตัวให้เข้าสังคมเมื่อพวกเขาออกจากคุก , โรงพยาบาล ฯลฯครูยังใช้ระบบสัญญาณระดับประถมศึกษา โดยให้ติดสติ๊กเกอร์เด็กรางวัลความประพฤติดีผ่าตัดปรับอากาศ ในห้องเรียนในสถานการณ์ปกติ การเรียนรู้ การเรียนรู้กลุ่มพฤติกรรมนิยมใช้ส่วนใหญ่ปัญหาของการเรียนและการจัดการของนักศึกษา แทนที่จะเรียนเนื้อหา มันเป็นเรื่องที่เกี่ยวข้องกับการสร้างสมรรถนะความสามารถวิธีที่ง่ายเพื่อรูปร่างพฤติกรรมให้ข้อเสนอแนะในการปฏิบัติ ผู้เรียน เช่น คำชมเชย อนุมัติ ส่งเสริม และการสัตยาบัน ตัวแปรอัตราส่วนผลิตผลสูงสุด อัตราการตอบสนองสำหรับนักเรียนที่เรียนรู้งานใหม่ ซึ่งตอนแรกเสริม ( เช่นสรรเสริญ ) เกิดขึ้นในช่วงเวลาบ่อยและเป็นประสิทธิภาพปรับปรุงเสริมเกิดขึ้นน้อยลง จนในที่สุดเพียง พิเศษ ผลจะช่วยตัวอย่างเช่น ถ้าครูต้องการให้นักเรียนตอบคำถามในชั้นเรียนควรสรรเสริญพวกเขาสำหรับความพยายามใดๆ ( ไม่ว่าคำตอบของพวกเขาถูกต้อง ) ค่อย ๆ ครูจะชมนักเรียนเมื่อคำตอบของพวกเขาจะถูกต้อง และในช่วงเวลาเพียงคำตอบที่ยอดเยี่ยมจะได้รับคำชมการวิจัยที่ไม่พึงประสงค์
การแปล กรุณารอสักครู่..
