Skinner's Theory: Operant Conditioning
B. F. Skinner's system is based on operant conditioning. The organism, while going about it's everyday activities, is in the process of “operating” on the environment. In the course of its activities, the organism encounters a special kind of stimulus, called a reinforcing stimulus, or simply a reinforcer. This special stimulus has the effect of increasing the the behavior occurring just before the reinforcer. This is operant conditioning: “the behavior is followed by a consequence, and the nature of the consequence modifies the organism's tendency to repeat the behavior in the future.” A behavior followed by a reinforcing stimulus results in an increased probability of that behavior occurring in the future.
Independent variables:
Type of reinforcement
Schedule of reinforcement
Dependent variables (measures of learning):
• Acquisition rate- how rapidly an animal can be trained to a new operant behavior as a function of reinforcement. Skinner typically deprived his lab animals of food for 24 or more hours before beginning a schedule of reinforcement. This tended to increase acquisition rate.
• Rate of response- this is a measure of learning that is very sensitive to different schedules of reinforcement. In most cases, animals were given intermittent schedules of reinforcement, so they were called upon to elicit the desired response at other times as well. Rate of response is a measure of correct responses throughout a testing schedule including the times when reinforcement is not provided after a correct response. It appears as if test animals build expectations when they are given rewards at predictable times (Animals which are fed at the same time each day become active as that time approaches, and a dog whose master comes home at the same time each day becomes more attentive around that time of day.) Also, Skinner found that when fixed interval reinforcement was used, the desired behavior would decrease or disappear just after a reinforcement, but when it was almost time for the next reinforcement, the animal would resume the desired responses.
• Extinction rate- The rate at which an operant response disappears following the withdrawal of reinforcement. Skinner found that continuous reinforcement schedules produced a faster rate of learning in the early stages of a training program, and also a more rapid extinction rate once the reinforcement was discontinued. A behavior no longer followed by the reinforcing stimulus results in a decreased probability of that behavior occurring in the future.
Types of reinforcement:
1 Primary reinforcement- instinctive behaviors lead to satisfaction of basic survival needs such as food, water, sex, shelter. No learning takes place because the behaviors emerge spontaneously
2 Secondary reinforcement - the reinforcer is not reinforcing by itself, but becomes reinforcing when paired with a primary reinforcer, such as pairing a sound or a light with food.
3 Generalized reinforcement - stimuli become reinforcing through repeated pairing with primary or secondary reinforcers. Many are culturally reinforced. For example, in human behavior, wealth, power, fame, strength, and intelligence are valued in many cultures. The external symbols of these attributes are generalized reinforcers. Money, rank, recognition, degrees and certificates, etc are strongly reinforcing to many individuals in the cultures that value the attributes they symbolize.
Reinforcers always follow a behavior and could be pleasant or unpleasant (noxious) and could be added to or removed from a situation. The following table summarizes the various combinations:
Add to a Situation After a Response:
Pleasant = Positive Reinforcement- Reward. Increases the probability of the same response occurring again. (Example: praise, monetary reward, food)
Noxious = Punishment- Administering a painful or unpleasant reinforcer after an unwanted response. Decreases the probability of the same response occurring again.(Examples: corporal punishment, electrical shocks, yelling)
Remove from a Situation After a Response:
Pleasant = Punishment - Decrease the probability of the same response occurring again (Example: punishing a teenager by taking away his cell phone or car keys.)
Noxious = Negative Reinforcement - Removing or decreasing an unpleasant or painful situation after a desirable response is produced. Increases the probability of the same response occurring again (Example: time off for good behavior)
Schedules of Reinforcement:
• Continuous reinforcement - reinforcement is given every time the animal gives the desired response.
• Intermittent reinforcement - reinforcement is given only part of the times the animal gives the desired response.
• Ratio reinforcement - a pre-determined proportion of responses will be reinforced.
• Fixed ratio reinforcement - reinforcement is given on a regular ratio, such as every fifth time the desired behavior is produced.
• Variable (random) fixed reinforcement- reinforcement is given for a predetermined proportion of responses, but randomly instead of on a fixed schedule.
• Interval reinforcement- reinforcement is given after a predetermined period of time.
• Fixed interval reinforcement - reinforcement is given on a regular schedule, such as every five minutes.
• Variable interval reinforcement - reinforcement is given after random amounts of time have passed.
In animal studies, Skinner found that continuous reinforcement in the early stages of training seems to increase the rate of learning. Later, intermittent reinforcement keeps the response going longer and slows extinction.
Skinner specifically addressed the applications of behaviorism and operant conditioning to educational practice. He believed that the goal of education was to train learners in survival skills for self and society. The role of the teacher was to reinforce behaviors that contributed to survival skills, and extinguish behaviors that did not. Behaviorist views have shaped much of contemporary education in children and adult learning.
ทฤษฎีสกินเนอร์:
ผ่าตัดปรับอากาศบี ระบบเอฟสกินเนอร์จะขึ้นอยู่กับเครื่องผ่าตัด สิ่งมีชีวิตในขณะที่ไปเกี่ยวกับเรื่องนี้เป็นกิจกรรมในชีวิตประจำวันอยู่ในขั้นตอนของ "การดำเนินงาน" ในสภาพแวดล้อม ในหลักสูตรของกิจกรรมที่มีชีวิตที่พบเป็นชนิดพิเศษของการกระตุ้นที่เรียกว่ากระตุ้นเสริมหรือเพียง reinforcer กระตุ้นเศรษฐกิจพิเศษนี้จะมีผลในการเพิ่มพฤติกรรมที่เกิดขึ้นก่อนที่จะ reinforcer นี่คือผ่าตัดปรับอากาศ: "พฤติกรรมตามด้วยผลและลักษณะของผลที่ปรับเปลี่ยนแนวโน้มที่มีชีวิตที่จะทำซ้ำพฤติกรรมในอนาคต." พฤติกรรมตามมาด้วยผลการกระตุ้นเสริมในความน่าจะเป็นที่เพิ่มขึ้นของพฤติกรรมที่เกิดขึ้นใน บริษัท A อนาคต.
ตัวแปรอิสระ:
ประเภทตารางการเสริมแรงเสริมตัวแปรขึ้นอยู่กับ (มาตรการของการเรียนรู้): •อัตราที่ได้มาซึ่งวิธีการอย่างรวดเร็วสัตว์สามารถถูกฝึกให้เป็นพฤติกรรมผ่าตัดใหม่เป็นหน้าที่ของการเสริมแรง สกินเนอร์มักจะขาดสัตว์ทดลองของเขาของอาหารเป็นเวลา 24 ชั่วโมงหรือมากกว่าก่อนที่จะเริ่มกำหนดการของการเสริมแรง นี้มีแนวโน้มที่จะเพิ่มอัตราการเข้าซื้อกิจการ. •อัตราการ response- นี้เป็นตัวชี้วัดของการเรียนรู้ที่มีความสำคัญมากที่จะตารางเวลาที่แตกต่างกันของการเสริมแรง ในกรณีส่วนใหญ่สัตว์ที่ได้รับตารางต่อเนื่องของการเสริมแรงเพื่อให้พวกเขาได้รับการเรียกร้องที่จะล้วงเอาการตอบสนองที่ต้องการในเวลาอื่น ๆ ได้เป็นอย่างดี อัตราการตอบสนองเป็นตัวชี้วัดของการตอบสนองที่ถูกต้องตลอดช่วงเวลาที่การทดสอบรวมทั้งเวลาที่เสริมไม่ให้หลังจากตอบที่ถูกต้อง มันจะปรากฏเป็นถ้าสัตว์ทดลองสร้างความคาดหวังเมื่อพวกเขาจะได้รับผลตอบแทนในช่วงเวลาที่คาดการณ์ (สัตว์ที่เป็นอาหารในเวลาเดียวกันในแต่ละวันจะใช้งานเป็นว่าวิธีการเวลาและสุนัขที่มีต้นแบบมาบ้านในเวลาเดียวกันในแต่ละวันจะกลายเป็นใส่ใจมากขึ้น ในช่วงเวลาของวันที่.) นอกจากนี้สกินเนอร์พบว่าเมื่อช่วงเวลาคงที่การเสริมแรงที่ใช้พฤติกรรมที่ต้องการจะลดลงหรือหายไปหลังจากที่การเสริมแรง แต่เมื่อมันเกือบจะเป็นเวลาสำหรับการเสริมแรงต่อไปสัตว์จะดำเนินการต่อการตอบสนองที่ต้องการ•การสูญเสียอัตราที่อัตราที่การตอบสนองผ่าตัดหายไปดังต่อไปนี้การถอนตัวของการเสริมแรงที่ สกินเนอร์พบว่าตารางการเสริมแรงอย่างต่อเนื่องการผลิตในอัตราที่เร็วของการเรียนรู้ในขั้นเริ่มต้นของโปรแกรมการฝึกอบรมและยังมีอัตราการสูญพันธุ์อย่างรวดเร็วมากขึ้นเมื่อการเสริมแรงก็หยุด พฤติกรรมที่ใช้ไม่ได้โดยการเสริมผลในการกระตุ้นความน่าจะเป็นที่ลดลงของพฤติกรรมที่เกิดขึ้นในอนาคต. ประเภทของการเสริมแรง: 1 ประถม reinforcement- พฤติกรรมสัญชาตญาณนำไปสู่การสร้างความพึงพอใจของการอยู่รอดพื้นฐานความต้องการเช่นอาหาร, น้ำ, เพศ, ที่พักพิง ไม่มีการเรียนรู้จะเกิดขึ้นเพราะพฤติกรรมโผล่ออกมาเป็นธรรมชาติ2 เสริมมัธยมศึกษา - reinforcer ที่ไม่ได้เสริมด้วยตัวเอง แต่กลายเป็นเสริมเมื่อจับคู่กับ reinforcer หลักเช่นการจับคู่เสียงหรือแสงที่มีอาหาร. 3 การเสริมแรงทั่วไป - เร้ากลายเป็นเสริมผ่าน การจับคู่ซ้ำกับ reinforcers ประถมหรือมัธยม หลายคนจะเสริมวัฒนธรรม ยกตัวอย่างเช่นในพฤติกรรมของมนุษย์, ความมั่งคั่งอำนาจชื่อเสียงความแข็งแรงและความฉลาดมีมูลค่าในหลายวัฒนธรรม สัญลักษณ์ภายนอกของคุณลักษณะเหล่านี้เป็น reinforcers ทั่วไป เงิน, อันดับการรับรู้องศาและใบรับรอง ฯลฯ จะขอเสริมให้กับประชาชนจำนวนมากในวัฒนธรรมที่มีค่าคุณสมบัติพวกเขาเป็นสัญลักษณ์. reinforcers มักจะทำตามพฤติกรรมและอาจจะเป็นที่พอใจหรือไม่พึงประสงค์ (พิษ) และสามารถเพิ่มหรือลบออกจาก สถานการณ์ ตารางต่อไปนี้สรุปชุดต่างๆ: เพิ่มเป็นสถานการณ์หลังจากการตอบสนอง: ก็ดี = บวก Reinforcement- รางวัล เพิ่มความน่าจะเป็นของการตอบสนองที่เกิดขึ้นเหมือนกันอีกครั้ง (ตัวอย่าง: สรรเสริญเงินรางวัล, อาหาร) พิษ = Punishment- บริหาร reinforcer เจ็บปวดหรือไม่พึงประสงค์หลังจากการตอบสนองที่ไม่พึงประสงค์ ลดความน่าจะเป็นของการตอบสนองเดียวกันเกิดขึ้นอีกครั้ง (ตัวอย่าง: การลงโทษทางร่างกายกระแทกไฟฟ้าตะโกน). ลบจากสถานการณ์หลังจากที่มีการตอบสนอง: ก็ดี = ลงโทษ - ลดความน่าจะเป็นของการตอบสนองเดียวกันเกิดขึ้นอีกครั้ง (ตัวอย่าง: การลงโทษวัยรุ่นโดยการ ออกไปโทรศัพท์มือถือของเขาหรือกุญแจรถ). พิษ = เสริมแรงเชิงลบ - ลบหรือลดลงสถานการณ์ที่ไม่พึงประสงค์หรือเจ็บปวดหลังจากที่มีการตอบสนองที่พึงประสงค์คือการผลิต เพิ่มความน่าจะเป็นของการตอบสนองเดียวกันเกิดขึ้นอีกครั้ง (ตัวอย่าง: เวลาออกสำหรับพฤติกรรมที่ดี) คำตารางเวลาของการเสริมแรง:. •การสนับสนุนอย่างต่อเนื่อง - การเสริมแรงจะได้รับทุกครั้งที่สัตว์จะช่วยให้การตอบสนองที่ต้องการ•การเสริมแรงเป็นระยะๆ - การเสริมแรงจะได้รับเพียงส่วนหนึ่งของเวลา สัตว์ให้การตอบสนองที่ต้องการ. •เสริมอัตราส่วน - สัดส่วนที่กำหนดไว้ล่วงหน้าของการตอบสนองจะได้รับการเสริม. •เสริมอัตราส่วนคงที่ - การเสริมแรงจะได้รับในอัตราปกติเช่นทุกครั้งที่ห้าพฤติกรรมที่ต้องการผลิต. •ตัวแปร (สุ่ม ) การเสริมแรง reinforcement- คงที่จะได้รับสำหรับสัดส่วนที่กำหนดไว้ล่วงหน้าของการตอบสนอง แต่สุ่มแทนในช่วงเวลาที่คงที่. เสริม•ช่วง reinforcement- จะได้รับหลังจากระยะเวลาที่กำหนดไว้ของเวลา. •เสริมช่วงเวลาคงที่ - การเสริมแรงจะได้รับในเวลาปกติ เช่นทุกห้านาที. •เสริมช่วงตัวแปร -. จะได้รับการเสริมแรงหลังจากที่จำนวนสุ่มของเวลาได้ผ่านการศึกษาในสัตว์กินเนอร์พบว่าการเสริมแรงอย่างต่อเนื่องในระยะแรกของการฝึกอบรมที่ดูเหมือนว่าจะเพิ่มอัตราของการเรียนรู้ ต่อมาการเสริมแรงต่อเนื่องช่วยให้การตอบสนองจะช้าอีกต่อไปและการสูญเสีย. สกินเนอร์โดยเฉพาะการแก้ไขการใช้งานของพฤติกรรมและเครื่องผ่าตัดในการฝึกศึกษา เขาเชื่อว่าเป้าหมายของการศึกษาคือการเรียนในการฝึกอบรมทักษะการอยู่รอดสำหรับตัวเองและสังคม บทบาทของครูคือการเสริมสร้างพฤติกรรมที่มีส่วนทำให้ทักษะการอยู่รอดและดับพฤติกรรมที่ไม่ได้ มุมมอง behaviorist มีรูปมากของการศึกษาร่วมสมัยในเด็กและเรียนรู้ของผู้ใหญ่
การแปล กรุณารอสักครู่..
