Classification of Imbalanced Data b

Classification of Imbalanced Data by Using the SMOTE Algorithm and
Locally Linear Embedding
Juanjuan Wang1, Mantao Xu2, Hui Wang2, Jiwu Zhang2
(1Department of Biomedical Engineering, Shanghai Jiaotong University, Shanghai, 200030)
(2Kodak Health Group Global R&D Center, Shanghai, 201206)
E-mail: wangjuanjuan@sjtu.edu.cn
Abstract
The classification of imbalanced data is a common
practice in the context of medical imaging intelligence.
The synthetic minority oversampling technique
(SMOTE) is a powerful approach to tackling the
operational problem. This paper presents a novel
approach to improving the conventional SMOTE
algorithm by incorporating the locally linear
embedding algorithm (LLE). The LLE algorithm is
first applied to map the high-dimensional data into a
low-dimensional space, where the input data is more
separable, and thus can be oversampled by SMOTE.
Then the synthetic data points generated by SMOTE
are mapped back to the original input space as well
through the LLE. Experimental results demonstrate
that the underlying approach attains a performance
superior to that of the traditional SMOTE.
1. Introduction
Imbalanced data classification often arises in many
practical applications in the context of medical pattern
recognition and data mining. Most of the existing
state-of-the-art classification approaches are well
developed by assuming the underlying training set is
evenly distributed. However, they are faced with a
severe bias problem when the training set is a highly
imbalanced distribution (i.e., the data comprises two
classes, the minority class C+ and the majority class
C

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

การจำแนกประเภทของข้อมูลขาดดุลโดยใช้อัลกอริทึม SMOTE และฝังภายในเส้นJuanjuan Wang1, Zhang2 Mantao Xu2 ฮุย Wang2, Jiwu(1Department วิศวกรรมชีวการแพทย์ มหาวิทยาลัย Jiaotong เซี่ยงไฮ้ เซี่ยงไฮ้ 200030)(2Kodak กลุ่มสุขภาพสากลศูนย์วิจัยและพัฒนา เซี่ยงไฮ้ 201206)อีเมล์: wangjuanjuan@sjtu.edu.cnบทคัดย่อการจัดประเภทของข้อมูลขาดดุลเป็นเรื่องธรรมดาปฏิบัติในบริบทของอัจฉริยะภาพทางการแพทย์เทคนิคการสุ่มได้สังเคราะห์ชนกลุ่มน้อย(ก็ตบ) เป็นวิธีมีประสิทธิภาพในการแก้ปัญหาการปัญหาการดำเนินงาน บทความนี้นำเสนอนวนิยายวิธีการปรับปรุง SMOTE ธรรมดาอัลกอริทึม โดยผสมผสานเชิงเส้นในท้องถิ่นฝังอัลกอริทึม (LLE) อัลกอริทึม LLEใช้กับแผนผังข้อมูลมิติสูงเป็นครั้งแรกมิติต่ำพื้นที่ เพิ่มเติมข้อมูลป้อนเข้าseparable และดังนั้น สามารถ oversampled โดย SMOTEแล้วจุดข้อมูลสังเคราะห์ที่สร้างขึ้น โดย SMOTEแมปไปพื้นที่ป้อนข้อมูลต้นฉบับเป็นอย่างดีผ่าน LLE ผลการทดลองแสดงให้เห็นถึงว่า วิธีพื้นฐานรบประสิทธิภาพการทำงานห้องที่ SMOTE แบบดั้งเดิม1. บทนำการจัดประเภทข้อมูลขาดดุลมักจะเกิดขึ้นในหลายประยุกต์ใช้งานจริงในบริบทของรูปแบบทางการแพทย์การรับรู้และการทำเหมืองข้อมูล ส่วนใหญ่ที่มีอยู่วิธีการจัดประเภทของศิลปะดีพัฒนา โดยสมมติเป็นชุดฝึกอบรมต้นแบบถูกกระจาย อย่างไรก็ตาม พวกเขากำลังเผชิญกับการปัญหา bias รุนแรงเมื่อเป็นชุดฝึกอบรมสูงการกระจายสินค้าที่ขาดดุล (กล่าวคือ ข้อมูลประกอบด้วยสองชั้น ชั้นชนก C + และชั้นส่วนใหญ่C

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.