SMOTE is a very popular method for

SMOTE is a very popular method for generating synthetic samples that can potentially diminish the class-imbalance problem. We applied SMOTE to high-dimensional class-imbalanced data (both simulated and real) and used also some theoretical results to explain the behavior of SMOTE. The main findings of our analysis are:

• in the low-dimensional setting SMOTE is efficient in reducing the class-imbalance problem for most classifiers;

• SMOTE has hardly any effect on most classifiers trained on high-dimensional data;

• when data are high-dimensional SMOTE is beneficial for k-NN classifiers if variable selection is performed before SMOTE;

• SMOTE is not beneficial for discriminant analysis classifiers even in the low-dimensional setting;

• undersampling or, for some classifiers, cut-off adjustment are preferable to SMOTE for high-dimensional class-prediction tasks.

Even though SMOTE performs well on low-dimensional data it is not effective in the high-dimensional setting for the classifiers considered in this paper, especially in the situations where signal-to-noise ratio in the data is small.

• in the low-dimensional setting SMOTE is efficient in reducing the class-imbalance problem for most classifiers;

• SMOTE has hardly any effect on most classifiers trained on high-dimensional data;

• when data are high-dimensional SMOTE is beneficial for k-NN classifiers if variable selection is performed before SMOTE;

• SMOTE is not beneficial for discriminant analysis classifiers even in the low-dimensional setting;

• undersampling or, for some classifiers, cut-off adjustment are preferable to SMOTE for high-dimensional class-prediction tasks.

Even though SMOTE performs well on low-dimensional data it is not effective in the high-dimensional setting for the classifiers considered in this paper, especially in the situations where signal-to-noise ratio in the data is small.

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

SMOTE เป็นวิธีนิยมมากสำหรับสร้างสังเคราะห์ตัวอย่างที่สามารถอาจลดปัญหาความไม่สมดุลระดับ เราใช้ SMOTE กับข้อมูลขาดดุลระดับสูงมิติ (จำลอง และจริง) และใช้ผลลัพธ์บางอย่างทฤษฎียังอธิบายการทำงานของ SMOTE ประเด็นหลักของการวิเคราะห์คือ:•ในการตั้งค่ามิติต่ำ SMOTE มีประสิทธิภาพในการลดปัญหาความไม่สมดุลระดับสำหรับคำหลักภาษามากที่สุด• SMOTE มีผลใด ๆ กับคำหลักภาษามากที่สุดการฝึกอบรมข้อมูลมิติสูงเมื่อข้อมูลมีมิติสูง SMOTE จะเป็นประโยชน์สำหรับคำหลักภาษา k-NN หากมีการเลือกตัวแปรก่อน SMOTE• SMOTE ไม่ได้เป็นประโยชน์สำหรับ discriminant วิเคราะห์คำหลักภาษาแม้ในการตั้งค่ามิติต่ำ• undersampling หรือ คำนามภาษาบาง ตัดปรับเป็น SMOTE สำหรับงานการคาดเดาระดับมิติสูงแม้ว่า SMOTE ทำดีบนข้อมูลมิติต่ำ มันไม่มีประสิทธิภาพในการตั้งค่ามิติสูงสำหรับคำหลักภาษาถือว่าในกระดาษนี้ โดยเฉพาะอย่างยิ่งในสถานการณ์ที่อัตราส่วนสัญญาณรบกวนในข้อมูลมีขนาดเล็ก

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

ฆ่าฟันเป็นวิธีที่นิยมมากสำหรับการสร้างตัวอย่างสังเคราะห์ที่อาจจะสามารถลดปัญหาระดับความไม่สมดุล เราใช้ประหารข้อมูลระดับขาดดุลสูงมิติ (ทั้งจำลองและจริง) และยังใช้ผลทฤษฎีบางอย่างที่จะอธิบายพฤติกรรมของโจมตี ผลการวิจัยหลักของการวิเคราะห์ของเรา:

•ในการตั้งค่าต่ำมิติประหารจะมีประสิทธิภาพในการลดปัญหาระดับความไม่สมดุลในการจําแนกมากที่สุด;

•ฆ่าฟันแทบจะไม่มีผลกระทบต่อการจําแนกส่วนใหญ่ได้รับการฝึกฝนกับข้อมูลสูงมิติ

•เมื่อข้อมูลที่อยู่ในระดับสูง มิติประหารเป็นประโยชน์สำหรับลักษณนาม K-NN ถ้าเลือกตัวแปรที่จะดำเนินการก่อนที่จะฆ่าฟัน;

•ประหารไม่ได้เป็นประโยชน์สำหรับการวิเคราะห์จำแนกลักษณนามแม้ในการตั้งค่าต่ำมิติ

• undersampling หรือสำหรับลักษณนามบางตัดปรับเป็นที่นิยมในการ ประหารสำหรับมิติสูงงานระดับทำนาย.

แม้ว่าประหารทำงานได้ดีบนข้อมูลต่ำมิติมันไม่ได้มีประสิทธิภาพในการตั้งค่าสูงมิติสำหรับลักษณนามพิจารณาในบทความนี้โดยเฉพาะอย่างยิ่งในสถานการณ์ที่สัญญาณต่อเสียงรบกวนอัตราส่วน ข้อมูลที่มีขนาดเล็ก

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.