Technically speaking, any data set that exhibits an unequal distribution between its classes can be considered imbalanced. However, the common understanding in the community is that imbalanced data correspond to data sets exhibiting significant, and in some cases extreme, imbalances. Specifically, this form of imbalance is referred to as a between-class imbalance; not uncommon are betweenclass imbalances on the order of 100:1, 1,000:1, and 10,000:1, where in each case, one class severely outrepresents another [4], [5], [6]. Although this description would seem to imply that all between-class imbalances are innately binary (or two-class), we note that there are multiclass data in which imbalances exist between the various classes [7], [8], [9], [10], [11], [12]. In this paper, we only briefly touch upon the multiclass imbalanced learning problem, focusing instead on the two-class imbalanced learning problem for space considerations.
เทคนิคการพูด ชุดใด ๆ ข้อมูลที่แสดงการกระจายไม่เท่ากันระหว่างการเรียนถือได้ว่าขาดดุล อย่างไรก็ตาม ความเข้าใจร่วมกันในชุมชนเป็นที่ขาดดุลข้อมูลสอดคล้อง กับชุดข้อมูลที่แสดงความสำคัญ และ ในบางกรณีที่รุนแรง ความไม่สมดุล เฉพาะ รูปแบบของความไม่สมดุลนี้เรียกว่าความไม่สมดุลของระหว่างชั้น ไม่ใช่เรื่องแปลก betweenclass ความไม่สมดุลระหว่าง 100: 1, 1, 000:1 และ 10, 000:1 ซึ่งในแต่ละกรณี ชั้นหนึ่งรุนแรง outrepresents อื่น [4] [5], [6] แม้ว่าคำอธิบายนี้จะดูเหมือนเป็น นัยว่า ความไม่สมดุลระหว่างระดับทั้งหมดมีกำเนิดไบนารี (หรือ ชั้นสอง), เราทราบว่า มี multiclass ข้อมูลที่มีอยู่ความไม่สมดุลระหว่างหลายชั้น [7], [8], [9], [10], [11], [12] ในกระดาษนี้ เราเพียงสั้น ๆ สัมผัสเมื่อมีปัญหาการเรียนรู้ขาดดุล multiclass แทนเน้นปัญหาสองชั้นเรียนขาดดุลพิจารณาพื้นที่
การแปล กรุณารอสักครู่..
