In the equation, pj,left and p j,right are probabilities that an instances, belong to class j, is on the left or right side of a potential split-point T.
The split-point with the lowest entropy is chosen to split the range into two intervals, and the binary split is continued with each part until a stopping criterion is satisfied. Fayyad and Irani propose a stopping criterion for this generalization using the minimum description length principle (MDLP) that stops the splitting when InfoGain(S, T) = Info(S) – Info(S, T) < δ Where T is a potential interval boundary that splits S into S1 (left) and S2 (right) parts, and
ในที่สมการ, PJ ,ด้านซ้ายและ P j ,ขวามีความน่าจะเป็นที่บางกรณีที่เป็นของ Class j ,อยู่ทางด้านซ้ายหรือด้านขวาของที่มี ศักยภาพ แบบแยกเป็นจุด T .
ที่แยก - จุดพร้อมด้วยที่ต่ำที่สุด Entropy คือเลือกที่จะแยกออกได้เป็นสองช่วงและไบนารีแบ่งออกเป็นแต่ละส่วนอย่างต่อเนื่องด้วยจนกว่าการหยุดเกณฑ์เป็นที่พอใจ.fayyad และ irani เสนอการหยุดเกณฑ์สำหรับนี้พูดคลุมทั่วๆไปโดยใช้หลักการความยาวขั้นต่ำคำอธิบาย( mdlp )ที่จะหยุดการแยกเมื่อ infogain ( S , T )=ข้อมูล( S ) - ข้อมูล( S , T )<Δ T ที่มี ศักยภาพ ช่วงเขตที่แยกไป S 1 (ด้านซ้าย)และ S 2 (ด้านขวา)ชิ้นส่วน,และ
การแปล กรุณารอสักครู่..