2. If X = ∅, then return the tree with root r and end.
3. Select x ∈ X and remove it from X, i.e., X := X {x}. Determine the “score”
sold (x) of node x before splitting, e.g., based on entropy.
4. Determine if splitting is possible/needed. If not, go to step 2, otherwise continue with the next step.
5. For all possible attributes a ∈ A, evaluate the effects of splitting on the attribute.
Select the attribute a providing the best improvement, i.e., maximize snew (x) −
sold
(x). The same attribute should not appear multiple times on the same path from the root. Also note that for numerical attributes, so-called “cut values” need to be determined (cf.
2 . ถ้า x = ∅แล้วกลับต้นไม้ที่มีราก R และสิ้นสุด .
3 เลือก∈ X X และลบออกจาก x 1 , x : = x { x } ตรวจสอบ " คะแนน "
ขาย ( X ) ของโหนด x ก่อนออกเช่นขึ้นอยู่กับเอนโทรปี .
4 ตรวจสอบว่า การแยกเป็นไปได้ / ต้องการ ถ้าไม่ไปขั้นตอนที่ 2 มิฉะนั้นขั้นถัดไป .
5 คุณลักษณะทั้งหมดที่เป็นไปได้∈ , ประเมินผลของการแยกบน
คุณลักษณะเลือก Attribute เป็นบริการแรกที่ดีที่สุด คือ เพิ่ม snew ( x ) −
ขาย
( X ) คุณลักษณะเดียวกันไม่ควรปรากฏหลายครั้งในเส้นทางเดียวกัน จากราก นอกจากนี้ยังทราบว่าคุณลักษณะที่สำคัญตัวเลขที่เรียกว่า " ตัดค่า " ต้องตัดสินใจ ( CF . < 8 และ≥ 8 ในรูปที่ 3.2 )
6 หากโครงการเป็นรูปธรรมเพียงพอ สร้างชุดของเด็กๆ Y
Y เพิ่ม X ( I , X := x ∪ y ) และการเชื่อมต่อกับโหนดลูกทุก x y .
7 เชื่อมโยงแต่ละโหนดใน Y ตั้งที่สอดคล้องกันของอินสแตนซ์และไปขั้นตอนที่ 2 .
ที่นี่เราเพียง แต่ให้ร่างคร่าวๆของขั้นตอนวิธีการทั่วไป การตัดสินใจการออกแบบจำนวนมากที่จำเป็นเพื่อให้คอนกรีตโครงสร้างการตัดสินใจเรียน ตัวอย่างเช่นหนึ่งต้องตัดสินใจเมื่อจะหยุดการเพิ่มโหนดนี้สามารถใช้ในการปรับปรุงการให้คะแนนการทำงานหรือเพราะต้นไม้จะต้องมีความลึกที่แน่นอน มีหลายวิธีที่จะเลือก แอตทริบิวต์ นี้จะขึ้นอยู่กับค่า ( ดูที่ด้านล่าง ) , ดัชนีจีนีของความหลากหลาย , ฯลฯ เมื่อเลือก แอตทริบิวต์ตัวเลขแยกบนตัดค่าต้องพิจารณาเพราะมันไม่มีเหตุผล / ไม่มีโหนดลูกทุกค่าที่เป็นไปได้ . ตัวอย่างเช่น ลูกค้าสามารถซื้อหมายเลขใด ๆของลาเต้ และมันจะไม่พึงประสงค์ที่จะแจกแจงความเป็นไปได้ทั้งหมดเมื่อใช้คุณลักษณะนี้เพื่อแยก ดังแสดงในรูปที่ 3.2 , โหนดลาเต้ได้เพียงสามลูกโหนดบนพื้นฐานสองตัด
ค่า CC โดเมนของจำนวนธรรมชาติใน { 0 } { 1 } , { 2 , 3 , . . . . } .
เหล่านี้เป็นเพียงไม่กี่ของหลายส่วนผสมที่กำหนดให้อัลกอริทึมการเรียนรู้ต้นไม้การตัดสินใจ
.
สิ่งสําคัญที่จะเห็นก็คือโดยการแยกชุดของอินสแตนซ์ในส่วนย่อยการเปลี่ยนแปลงภายในแต่ละส่วนย่อยจะเล็กลง นี้สามารถที่ดีที่สุดที่แสดงการใช้ความคิดของเอนโทรปี .
การแปล กรุณารอสักครู่..