When applying machine learning to real world classification
problems two complications that often arise are imbalanced
classes (one class occurs much more often than the
other (Kubat, Holte, & Matwin 1998; Ezawa, Singh, & Norton
1996; Fawcett & Provost 1996)) and asymmetric misclassification
costs (the cost of misclassifying an example
from one class is much larger than the cost of misclassifying
an example from the other class (Domingos 1999;
Pazzani et al. 1997)). Traditional learning algorithms,
which aim to maximize accuracy, treat positive and negative
examples as equally important and therefore do not always
produce a satisfactory classifier under these conditions. Furthermore,
in these circumstances accuracy is not an appropriate
measure of classifier performance (Provost, Fawcett,
& Kohavi 1998). Class imbalance and asymmetric misclassification
costs are related to one another. One way to counteract
imbalance is to raise the cost of misclassifying the minority
class. Conversely one way to make an algorithm cost
sensitive is to intentionally imbalance the training set
When applying machine learning to real world classificationproblems two complications that often arise are imbalancedclasses (one class occurs much more often than theother (Kubat, Holte, & Matwin 1998; Ezawa, Singh, & Norton1996; Fawcett & Provost 1996)) and asymmetric misclassificationcosts (the cost of misclassifying an examplefrom one class is much larger than the cost of misclassifyingan example from the other class (Domingos 1999;Pazzani et al. 1997)). Traditional learning algorithms,which aim to maximize accuracy, treat positive and negativeexamples as equally important and therefore do not alwaysproduce a satisfactory classifier under these conditions. Furthermore,in these circumstances accuracy is not an appropriatemeasure of classifier performance (Provost, Fawcett,& Kohavi 1998). Class imbalance and asymmetric misclassificationcosts are related to one another. One way to counteractimbalance is to raise the cost of misclassifying the minorityclass. Conversely one way to make an algorithm costsensitive is to intentionally imbalance the training set
การแปล กรุณารอสักครู่..

เมื่อใช้เครื่องเรียนรู้โลกจริงหมวดหมู่
ปัญหาสองภาวะแทรกซ้อนที่มักเกิดขึ้นเป็น imbalanced
เรียน ( Class หนึ่งเกิดขึ้นมากบ่อยกว่า
( kubat holte , & matwin , 1998 ; ezawa ซิงห์ & Norton
, 1996 ; ฟอว์เซตต์&พระครู 1996 ) และค่าใช้จ่าย ( ต้นทุนของการผิดพลาด
misclassifying ตัวอย่าง
ห้องหนึ่งมีขนาดใหญ่กว่าต้นทุนของ misclassifying
ตัวอย่างจากห้องอื่น ( โดมิงโกส ปี 1999 ;
pazzani et al . 1997 ) อัลกอริทึมการเรียนรู้แบบดั้งเดิม , ซึ่งมีจุดมุ่งหมายเพื่อเพิ่มความถูกต้อง
รักษาบวกและลบตัวอย่างที่สำคัญอย่างเท่าเทียมกันและดังนั้นจึงไม่ได้เสมอ
ผลิตเป็นที่น่าพอใจ ลักษณนามภายใต้เงื่อนไขเหล่านี้ นอกจากนี้
ในสถานการณ์เหล่านี้มีความถูกต้อง ไม่ใช่มาตรการที่เหมาะสมในการปฏิบัติตัว ( พระครู
,
& kohavi ฟอว์เซตต์ , 1998 ) ความไม่สมดุลของชั้นเรียนและค่าใช้จ่ายผิดพลาด
อสมมาตรเกี่ยวข้องกับอีกคนหนึ่ง วิธีหนึ่งในการต่อสู้กับ
ความไม่สมดุลจะเพิ่มค่าใช้จ่ายของ misclassifying ส่วนน้อย
เรียน ในทางกลับกัน วิธีหนึ่งที่จะทำให้ขั้นตอนวิธีต้นทุน
ที่สําคัญคือการจงใจไม่สมดุล ชุดฝึกอบรม
การแปล กรุณารอสักครู่..
