Used by the CART (classification and regression tree) algorithm, Gini impurity is a measure of how often a randomly chosen element from the set would be incorrectly labeled if it was randomly labeled according to the distribution of labels in the subset. Gini impurity can be computed by summing the probability {displaystyle f_{i}} f_{i} of an item with label {displaystyle i} i being chosen times the probability {displaystyle 1-f_{i}} 1-f_{i} of a mistake in categorizing that item. It reaches its minimum (zero) when all cases in the node fall into a single target category.
To compute Gini impurity for a set of items with {displaystyle J} J classes, suppose {displaystyle iin {1,2,...,J}} {displaystyle iin {1,2,...,J}}, and let {displaystyle f_{i}} f_{i} be the fraction of items labeled with class {displaystyle i} i in the set.
ใช้ โดยขั้นตอนวิธี (ต้นไม้การจำแนกและการถดถอย) รถเข็น Gini ที่บริสุทธิ์เป็นการวัดความถี่เป็นองค์ประกอบที่สุ่มเลือกจากชุดจะมีไม่ถูกต้องชื่อถ้ามันถูกติดป้ายชื่อแบบสุ่มตามการกระจายของป้ายชื่อในชุดย่อย Gini บริสุทธิ์สามารถคำนวณ โดยการรวม f_ น่าเป็น {displaystyle f_ {i } } {i } สินค้าป้าย { displaystyle ฉัน} ผมเลือกในเวลาน่าเป็น {displaystyle 1-f_ {i } } 1-f_ {i } ของความผิดพลาดในการจัดประเภทสินค้าได้ จะถึงค่าต่ำสุด (ศูนย์) เมื่อทุกกรณีในโหนที่ตกอยู่ในประเภทเดี่ยวคำนวณสิ่งเจือปน Gini สำหรับชุดของสินค้ากับ J {displaystyle J } สมมติว่า { displaystyle iin {1,2,...,J } } { displaystyle iin {1,2,...,J } }, และ f_ ให้ {displaystyle f_ {i } } {i } เป็นเศษส่วนของสินค้าที่ติดป้ายชื่อ ด้วยชั้น { displaystyle ฉัน} ผมในชุด
การแปล กรุณารอสักครู่..

ใช้โดยรถเข็น (จำแนกและต้นไม้ถดถอย) ขั้นตอนวิธีการ Gini ไม่บริสุทธิ์เป็นตัวชี้วัดของวิธีการที่มักจะเป็นองค์ประกอบที่สุ่มเลือกจากชุดที่จะต้องติดฉลากไม่ถูกต้องถ้ามันถูกตราหน้าว่าสุ่มตามการกระจายของป้ายชื่อในกลุ่มย่อยที่ Gini สิ่งเจือปนสามารถคำนวณได้จากข้อสรุปน่าจะเป็น { displaystyle F_ {i}} F_ {i} ของรายการที่มีป้าย { displaystyle i} ฉันได้รับการแต่งตั้งครั้งน่าจะเป็น { displaystyle 1 F_ {i}} 1 F_ {i} จากความผิดพลาดในการจัดหมวดหมู่รายการที่ จะถึงขั้นต่ำ (ศูนย์) เมื่อทุกกรณีในโหนตกอยู่ในหมวดหมู่เป้าหมายเดียว.
การคำนวณ Gini สิ่งเจือปนสำหรับชุดของรายการที่มี { displaystyle J} เรียน J a สมมติว่า { displaystyle i ใน {1,2 , ... , J }} { displaystyle ฉัน in {1,2, ... , J }} และให้ { displaystyle F_ {i}} F_ {i} เป็นส่วนของรายการที่มีข้อความว่า กับการเรียน { displaystyle i} ฉันอยู่ในชุด
การแปล กรุณารอสักครู่..

ใช้รถเข็น ( หมวดหมู่ต้นไม้ถดถอย ) โดย Gini บริสุทธิ์เป็นตัวชี้วัดว่ามักจะสุ่มเลือกองค์ประกอบจากการตั้งค่าจะไม่ถูกต้องระบุว่าถ้ามันสุ่มป้ายตามการกระจายของป้ายชื่อในย่อย . ี่บริสุทธิ์สามารถคำนวณได้จากการรวม displaystyle f_ ความน่าจะเป็น { { ฉัน } } f_ { ฉัน } { ป้ายของสินค้ากับ displaystyle i } ฉันได้รับเลือกครั้ง ความน่าจะเป็น displaystyle 1-f_ { { ผม } } { ฉัน } 1-f_ ของความผิดพลาดในการแยกแยะสินค้าที่ มันถึงน้อย ( ศูนย์ ) เมื่อทุกกรณีในโหนดตกอยู่ในเป้าหมายประเภทเดี่ยวคำนวณค่า Gini บริสุทธิ์สำหรับชุดของรายการที่มี displaystyle J } { J ชั้นคิดว่า { displaystyle ) { 1 , 2 , . . . , J } } { displaystyle ) { 1 , 2 , . . . , J } } และ { displaystyle ให้ f_ { ฉัน } } { ฉัน } f_ เป็นเศษส่วนของรายการข้อความที่มีระดับ { displaystyle ฉัน ฉันอยู่ในชุด
การแปล กรุณารอสักครู่..
