we first sort the
attribute values in the training instances. We then compute the information gain
obtained by splitting at each value. For example, if the training instances have
values 1, 10, 15, and 25 for an attribute, the split points considered are 1, 10, and
15; in each case values less than or equal to the split point form one partition
and the rest of the values form the other partition. The best binary split for the
attribute is the split that gives the maximum information gain.
ครั้งแรกที่เราจัดเรียงค่าแอตทริบิวต์
ในกรณีการฝึกอบรม จากนั้นเราจะคำนวณกำไร
ข้อมูลที่ได้รับโดยแยกมูลค่าที่แต่ละ ตัวอย่างเช่นถ้ากรณีการฝึกอบรมมีค่า 1
, 10, 15, และ 25 แอททริบิ, จุดแยกการพิจารณาเป็นที่ 1, 10, และ
15; ในแต่ละกรณีค่าน้อยกว่าหรือเท่ากับรูปแบบจุดแยกที่หนึ่งพาร์ทิชัน
และส่วนที่เหลือของค่ารูปแบบพาร์ทิชันอื่น ๆแยกไบนารีที่ดีที่สุดสำหรับแอตทริบิวต์
คือแยกที่จะช่วยให้ได้รับข้อมูลสูงสุด
การแปล กรุณารอสักครู่..
![](//thimg.ilovetranslation.com/pic/loading_3.gif?v=b9814dd30c1d7c59_8619)