Utility-based agents
Goals alone are not really enough to generate high-quality behavior. For example, there are many
action sequences that will get the taxi to its destination, thereby achieving the goal, but some
are quicker, safer, more reliable, or cheaper than others. Goals just provide a crude distinction
between “happy” and “unhappy” states, whereas a more general performance measure should
allow a comparison of different world states (or sequences of states) according to exactly how
happy they would make the agent if they could be achieved. Because “happy” does not sound
very scientific, the customary terminology is to say that if one world state is preferred to another,
then it has higher utility for the agent.8
Utility is therefore a function that maps a state9 onto a real number, which describes the
associated degree of happiness. A complete specification of the utility function allows rational
decisions in two kinds of cases where goals have trouble. First, when there are conflicting goals,
only some of which can be achieved (for example, speed and safety), the utility function specifies
the appropriate trade-off. Second, when there are several goals that the agent can aim for, none
ยูทิลิตี้ที่ใช้ตัวแทน
เป้าหมายคนเดียวไม่เพียงพอที่จะสร้างพฤติกรรมที่มีคุณภาพสูง ตัวอย่าง มีลำดับการกระทำหลายอย่าง
จะเรียกแท็กซี่ไปยังปลายทาง เพื่อบรรลุเป้าหมาย แต่บาง
เป็นรวดเร็ว , ปลอดภัย , เชื่อถือได้มากขึ้น หรือราคาถูกกว่าคนอื่น ๆ เป้าหมายเพียงแค่ให้แตกต่างดิบ
ระหว่าง " สุข " และ " ทุกข์ " รัฐยูทิลิตี้ที่ใช้ตัวแทน
เป้าหมายคนเดียวไม่เพียงพอที่จะสร้างพฤติกรรมที่มีคุณภาพสูง ตัวอย่าง มีลำดับการกระทำหลายอย่าง
จะเรียกแท็กซี่ไปยังปลายทาง เพื่อบรรลุเป้าหมาย แต่บาง
เป็นรวดเร็ว , ปลอดภัย , เชื่อถือได้มากขึ้น หรือราคาถูกกว่าคนอื่น ๆ เป้าหมายเพียงแค่ให้แตกต่างดิบ
ระหว่าง " สุข " และ " ทุกข์ " รัฐสาธารณูปโภคจึงเป็นฟังก์ชันที่แผนที่เป็น state9 บนจํานวนจริง ซึ่งอธิบาย
ที่เกี่ยวข้องระดับของความสุข สเปคที่สมบูรณ์ของฟังก์ชันยูทิลิตี้ช่วยให้เหตุผลในการตัดสินใจ
สองชนิดของกรณีที่เป้าหมายมีปัญหา ครั้งแรก เมื่อมีเป้าหมายที่ขัดแย้งกัน ,
เพียงบางส่วนที่สามารถทำได้ เช่น ความเร็ว และความปลอดภัย ) , ฟังก์ชันอรรถประโยชน์ระบุ
ส่วนการวัดประสิทธิภาพทั่วไปควร
ให้เปรียบเทียบของรัฐโลกที่แตกต่างกัน ( หรือลำดับของรัฐ ) ตามที่ว่า
มีความสุขเขาจะให้ตัวแทนถ้าพวกเขาอาจจะประสบความสำเร็จ เพราะ " ความสุข " ไม่เสียง
มากทางวิทยาศาสตร์ คำศัพท์จารีตประเพณีคือกล่าวว่า หากรัฐโลกต้องการอื่น
ก็สูงกว่าโปรแกรมสำหรับตัวแทน 8
.การแลกเปลี่ยนที่เหมาะสม ประการที่สอง เมื่อมีเป้าหมายหลายอย่างที่ตัวแทนสามารถเล็งเลย
การแปล กรุณารอสักครู่..
