In this component, the parameters of the classifiers in [A] are re-estimated
according to the reward R returned by the environment as a consequence
of the system’s taking action ak . First, the predictions are updated: pj ←pj + β(R − pj ). Next, the errors: j ← j + β(|R − pj |). Third, for each
Cj, an accuracy κj is computed: κj = 0.1(j /0)
−ν, for j > 0, else 1.0.
The parameter 0 is termed the error threshold; ν is a positive integer. Note
that classifiers in [A] with j ≤ 0 have equal accuracies. Fourth, from the κj ,
each classifier’s relative accuracy κ
j is computed: κ
j
= κj /j κj . Finally
the fitnesses Fj are updated according to: Fj ← Fj + β(κ
j
− Fj ).
2.3 Discovery
On some time-steps, XCS executes a genetic algorithm (GA) within [A]. Two
classifiers are chosen probabilistically based on their fitnesses and copied.
The copies are crossed (two-point crossover) with probability χ, and then
mutated with probability μ per allele. The resulting offspring are inserted
into [P]; if the population size is already at its maximum value, N, two classifiers
are deleted. The probability of deletion of a classifier is determined by
Kovacs’s (1999) method and is designed to preferentially remove low-fitness
classifiers that have participated in a threshold number of action sets – that is,
have had sufficient time for their parameters to be accurately estimated.Whether or not to execute the GA on a given time-step is determined as
follows. The system keeps a count of the number of time-steps since the
beginning of a run. Every time a GA occurs, the classifiers in that [A] are
“time-stamped” with the current count. Whenever an [A] is formed, the timestamp
values of its members are averaged and subtracted from the current
count; if the difference exceeds a threshold θGA, a GA takes place.
A macroclassifier technique is used to speed processing and provide a
more perspicuous view of population contents. Whenever a new classifier is
generated by the GA (or covering), [P] is scanned to see if there already exists
a classifier with the same condition and action. If so, the numerosity parameter
of the existing classifier is incremented by one, and the new classifier
is discarded. If not, the new classifier is inserted into [P]. The resulting population
consists entirely of structurally unique classifiers, each with numerosity
≥ 1. If a classifier is chosen for deletion, its numerosity is decremented by 1,
unless the result would be 0, in which case the classifier is removed from [P].
All operations in a population of macroclassifiers are carried out as though
the population consisted of conventional classifiers; that is, the numerosity is
taken into account. In a macroclassifier population, the sum of numerosities
equals N, the traditional population size. [P]’s actual size in macroclassifiers,
M, is of interest as a measure of the population’s space complexity.
ในส่วนนี้, พารามิเตอร์ของลักษณนามใน [] จะได้รับการประเมิน
ตามรางวัล R กลับมาจากสภาพแวดล้อมที่เป็นผล
ของการกระทำ AK การของระบบ ครั้งแรกที่การคาดการณ์ที่มีการปรับปรุง: pj ← pj + β (R - pj) ต่อข้อผิดพลาด? J ← J + β (| R - PJ |) ประการที่สามสำหรับแต่ละ
Cj, κjความถูกต้องคือการคำนวณ: κj = 0.1 (เจ / 0?)
-νสำหรับ J> 0 อื่น 1.0?
พารามิเตอร์ 0 จะเรียกว่าเกณฑ์ข้อผิดพลาด? νเป็นจำนวนเต็มบวก ทราบ
ว่าลักษณนามใน [] ด้วย? J ≤ 0 มีความถูกต้องเท่าเทียมกัน ประการที่สี่จากκj,
แต่ละลักษณนามความแม่นยำความκ ญวณ: κ J = κj / เจκj? สุดท้ายfitnesses Fj มีการปรับปรุงตาม: Fj ← Fj + β (κ J - Fj) 2.3 การค้นพบในบางขั้นตอนเวลา XCS ดำเนินการขั้นตอนวิธีพันธุกรรม (GA) ภายใน [] สองตัวจําแนกได้รับการแต่งตั้งขึ้นอยู่กับความน่าจะเป็นของพวกเขา fitnesses และคัดลอกสำเนาที่มีการข้าม (ครอสโอเวอร์สองจุด) ด้วยความน่าจะχแล้วกลายพันธุ์ที่มีความน่าจะเป็นμต่ออัลลีล ลูกหลานที่เกิดขึ้นจะถูกแทรกเข้าไปใน [P]; ถ้าขนาดของประชากรที่มีอยู่แล้วในราคาสูงสุดที่ N สองลักษณนามจะถูกลบออก น่าจะเป็นของการลบลักษณนามจะถูกกำหนดโดย(1999) วิธีการว๊ากซ์และถูกออกแบบมาเพื่อพิเศษลบต่ำออกกำลังกายแยกแยะว่ามีส่วนร่วมในจำนวนเกณฑ์ของชุดการดำเนินการ - นั่นคือเวลาเพียงพอที่จะมีสำหรับพารามิเตอร์ของพวกเขาจะได้รับการประเมินอย่างถูกต้อง .Whether หรือไม่ที่จะดำเนินการ GA ในเวลาขั้นตอนที่กำหนดจะถูกกำหนดเป็นดังนี้ ระบบจะนับจำนวนของขั้นตอนที่ใช้เวลาตั้งแต่จุดเริ่มต้นของการทำงาน ทุกครั้งที่ GA เกิดขึ้นลักษณนามในที่ [] เป็น"เวลาที่ประทับ" ด้วยการนับปัจจุบัน เมื่อใดก็ตามที่ [] มีรูปแบบการประทับเวลาค่าของสมาชิกนำมาเฉลี่ยและหักออกจากปัจจุบันนับ; ถ้าความแตกต่างเกินเกณฑ์θGA, GA เกิดขึ้นเทคนิค macroclassifier ถูกนำมาใช้เพื่อเพิ่มความเร็วในการประมวลผลและให้มุมมองที่ชัดแจ้งมากขึ้นของเนื้อหาประชากร เมื่อใดก็ตามที่ลักษณนามใหม่จะถูกสร้างขึ้นโดย GA (หรือปิด), [P] ถูกสแกนเพื่อดูว่ามีอยู่แล้วลักษณนามกับสภาพเดิมและการกระทำ ถ้าเป็นเช่นนั้นพารามิเตอร์ numerosity ของลักษณนามที่มีอยู่เพิ่มขึ้นโดยหนึ่งและลักษณนามใหม่ถูกละทิ้ง ถ้าไม่ลักษณนามใหม่จะถูกใส่เข้าไปใน [P] ประชากรที่เกิดขึ้นประกอบด้วยทั้งหมดของลักษณนามไม่ซ้ำกันโครงสร้างแต่ละคนมี numerosity ≥ 1 ถ้าลักษณนามถูกเลือกสำหรับการลบ, numerosity ของมันจะลดลงทีละ 1 จนกว่าผลจะเป็น 0 ซึ่งในกรณีลักษณนามถูกลบออกจาก [P] การดำเนินงานทั้งหมดในประชากร macroclassifiers จะดำเนินการว่ามีประชากรที่ประกอบด้วยลักษณนามธรรมดา; นั่นคือ numerosity จะถูกนำมาพิจารณา ในประชากร macroclassifier ผลรวมของ numerosities เท่ากับไม่มีขนาดประชากรดั้งเดิม [P] ของขนาดจริงใน macroclassifiers, M, เป็นที่น่าสนใจเป็นตัวชี้วัดของความซับซ้อนพื้นที่ของประชากร
การแปล กรุณารอสักครู่..
ในส่วนนี้ ค่าพารามิเตอร์ของคำลักษณะนามใน [ ] มีอีกประมาณ
ตามรางวัล R กลับมาจากสิ่งแวดล้อมที่เป็นผลของการกระทำของระบบ
AK . แรก , คาดคะเนได้รับการปรับปรุง : พีเจ PJ ←บีตา ( r − PJ ) ต่อไป ข้อผิดพลาด : J J ← บีตา ( | R − PJ | ) 3 สำหรับแต่ละ
CJ ความถูกต้องκ J จะคำนวณ : κ J = 0.1 ( J / 0 )
−ν , J > 0
อีก 1.0พารามิเตอร์ 0 เป็น termed เกณฑ์ข้อผิดพลาด ; νเป็นจํานวนเต็มบวก หมายเหตุ
ว่าคำลักษณนามใน [ ] กับ J ≤ 0 ได้เท่ากับความถูกต้อง . ที่สี่จากκ J ,
แต่ละตัวญาติของความถูกต้องκ
J จะคำนวณ : κ
J
= κ J / J κ J . ในที่สุด
fitnesses FJ อัพเดทตาม : fj ← FJ บีตา ( κ
J
− FJ )
3
ในบางขั้นตอนการค้นพบครั้งxcs รันขั้นตอนวิธีเชิงพันธุกรรม ( GA ) ภายใน [ 1 ] 2
คำเลือก probabilistically ตาม fitnesses ของพวกเขาและคัดลอก .
ชุดข้าม ( สองจุดครอสโอเวอร์ ) กับความน่าจะเป็นχแล้ว
μกลายพันธุ์กับความน่าจะเป็นต่ออัลลีล . ให้ลูกหลานใส่
เป็น [ P ] ; ถ้าขนาดของประชากรอยู่ที่มูลค่าสูงสุด , N ,
2 คำจะถูกลบออกความน่าจะเป็นของการลบลักษณนามที่ถูกกำหนดโดย
โคแวคส์ ( 1999 ) และถูกออกแบบมาเพื่อลบคำ preferentially ฟิต
ต่ำที่ได้มีส่วนร่วมในหมายเลขของชุดปฏิบัติการ–นั่นคือ
มีเวลาเพียงพอสำหรับพารามิเตอร์ของพวกเขาจะประมาณได้ หรือไม่สามารถ รันที่ได้รับกา เวลาที่ขั้นตอนที่ถูกกำหนดเป็น
1ระบบที่ช่วยให้นับจํานวนของขั้นตอนเวลาตั้งแต่
เริ่มวิ่ง ทุกครั้งที่กายเกิดขึ้น คำลักษณนามใน [ ]
" การประทับเวลา " กับปัจจุบันนับ เมื่อมี [ ] มีรูปแบบ , การประทับเวลา
ค่าสมาชิกจะเฉลี่ยและหักออกจากการนับปัจจุบัน
; ถ้าต่างกันเกินเกณฑ์θ GA , GA
ใช้เวลาสถานที่เทคนิค macroclassifier ใช้ความเร็วการประมวลผล และให้ชัดเจนมากขึ้น
มุมมองของเนื้อหา ) เมื่อใดก็ตามที่ใหม่ลักษณนามคือ
ที่เกิดจากกา ( หรือทั้งหมด ) , [ P ] จะถูกสแกนเพื่อดูว่ามันมีอยู่แล้ว
ลักษณนาม ด้วยเงื่อนไขเดียวกัน และการกระทำ ถ้าเป็นเช่นนั้น numerosity พารามิเตอร์
ที่มีอยู่ของลักษณนามคือสั่งโดยหนึ่งและใหม่จนได้
ถูกทิ้ง .ถ้า ไม่ ใหม่ ตัวจะถูกแทรกลงใน [ P ] ซึ่งประกอบด้วยทั้งหมดของโครงสร้างประชากร
เฉพาะคำแต่ละ numerosity
≥ 1 ถ้าเป็นตัวเลือกสำหรับการลบของ numerosity เป็น decremented โดย 1
นอกจากผลจะเป็น 0 ซึ่งในกรณีที่ตัวออกจาก [ P ] .
งานทั้งหมดในประชากร macroclassifiers จะดําเนินการเหมือน
จำนวนคำปกติ นั่นคือ numerosity คือ
เข้าบัญชี ใน macroclassifier ประชากร เท่ากับผลรวมของ numerosities
n ประชากรดั้งเดิมขนาด [ P ] ขนาดจริงใน macroclassifiers
, M , สนใจเป็นวัดความซับซ้อนของพื้นที่ของประชากร
การแปล กรุณารอสักครู่..