Example Application
Recently, a number of human functional magnetic resonance imaging (fMRI) studies have used a method called model-based fMRI – predictions derived from a computational model of behavior are correlated with fMRI data to determine brain areas related to postulated decision-making processes. These studies have shown that blood-oxygen-level-dependent (BOLD) activations in brain regions including the striatum and orbitofrontal cortex correlate with prediction error signals from a computational model of learning called the temporal-difference reinforcement learning model which is discussed in detail in Chapters 15, 16 and 17 Chapter 15 Chapter 16 Chapter 17. Below we illustrate the method of computational modeling and model-based fMRI analysis for a study ( Ahn et al., 2009) that investigated decision making using the Iowa Gambling Task (IGT) ( Bechara et al., 1994). 2
The goal of a subject in the IGT is to maximize monetary gains while repeatedly choosing cards from one of four decks. Each selection results in a monetary gain, a draw (neither a gain nor a loss), or a loss. There are two “good” decks (say decks 1 and 2) with long-term gains and two “bad” decks (say 3 and 4) with long-term losses. However, the typical win is larger for the bad decks than the good decks, putting the magnitude of the potential immediate gain into opposition with the long-term cumulative outcome from the decks. Participants need to learn from experience which decks are advantageous for good performance over the long term.
We will use a computational model for this task called the Prospect Valence Learning (PVL) model ( Ahn et al., 2008), which is based on three assumptions. First, it is assumed that the net payoff experienced on each trial t, denoted as x(t) with x(t)=(win(t)−|lose(t)|), produces an affective experience that is represented by a utility function on trial t, u(t) expressed as:
ตัวอย่างประยุกต์
ล่าสุด หมายเลขของมนุษย์ทำงานแม่เหล็กสั่นพ้องภาพ (fMRI) ศึกษาได้ใช้วิธีเรียกว่าเซ fMRI – คาดการณ์จากแบบจำลองคอมพิวเตอร์ของพฤติกรรมมี correlated กับ fMRI ข้อมูลเพื่อกำหนดพื้นที่ของสมองที่เกี่ยวข้องกับกระบวนการตัดสินใจ postulated การศึกษานี้ได้แสดงว่า เลือดออกซิเจนระดับขึ้นอยู่กับการเปิดใช้งาน (ตัวหนา) ในภูมิภาคสมอง cortex striatum และ orbitofrontal รวมทั้งสร้างความสัมพันธ์กับสัญญาณผิดพลาดคาดเดาจากรูปแบบการคำนวณเรียกว่าการเรียนรู้เสริมขมับแตกต่างเรียนรู้รุ่นที่กล่าวถึงในรายละเอียดในบทที่ 15, 16 และ 17 บทที่ 15 บทที่ 16 บทที่ 17 ด้านล่างเราแสดงวิธีการสร้างโมเดลการคำนวณและวิเคราะห์ตามรุ่น fMRI ศึกษา (อาห์น et al., 2009) ที่สอบสวนตัดสินใจใช้รัฐไอโอวาพนันงาน (IGT) (Bechara et al., 1994) 2
เป้าหมายของเรื่องใน IGT จะเพิ่มเงินกำไรขณะที่การเลือกไพ่จากสำรับ 4 ซ้ำ ๆ เลือกแต่ละผลกำไรเงิน วาด (ไม่มีกำไรหรือขาดทุน), หรือสูญหาย มีสองชั้น "ดี" (บอกชั้น 1 และ 2) กำไรระยะยาวและสอง "ไม่ดี" สำรับ (กล่าว 3 และ 4) กับการขาดทุนระยะยาว อย่างไรก็ตาม ชนะโดยทั่วไปมีขนาดใหญ่สำหรับชั้นดีกว่าชั้นดี ใส่ขนาดของกำไรทันทีอาจเป็นฝ่ายค้านกับผลสะสมระยะยาวจากชั้น ผู้เรียนต้องเรียนรู้จากประสบการณ์ที่สำรับที่มีประโยชน์สำหรับประสิทธิภาพที่ดีกว่า term. ยาว
เราจะใช้แบบจำลองคำนวณสำหรับงานนี้เรียกว่าแบบจำลองโน้มเวเลนซ์เรียน (PVL) (อาห์น et al., 2008), ซึ่งเป็นไปตามสมมติฐานที่ 3 การ ครั้งแรก มันเป็นสมมติว่า ผลตอบแทนสุทธิที่มีประสบการณ์ในการทดลองแต่ละ t สามารถบุเป็น x(t) กับ x(t)=(win(t)−|lose(t)|) สร้างประสบการณ์ผลที่แสดง ด้วยฟังก์ชันอรรถประโยชน์ในการทดลอง t, u(t) แสดงเป็น:
การแปล กรุณารอสักครู่..