We introduce a novel algorithm call

We introduce a novel algorithm called Upper Confidence Weighted Learning (UCWL) for online multiclass learning from binary feedback (e.g., feedback that indicates whether the prediction was right or wrong).

UCWL combines the Upper Confidence Bound (UCB) framework with the Soft Confidence Weighted (SCW) online learning scheme. In UCB, each instance is classified using both score and uncertainty.

For a given instance in the sequence, the algorithm might guess its class label primarily to reduce the class uncertainty.

This is a form of informed exploration, which enables the performance to improve with lower sample complexity compared with the case without exploration.

Combining UCB with SCW leads to the ability to deal well with noisy and non-separable data, and state-of-the-art performance is achieved without increasing the computational cost. A potential application setting is human-robot interaction (HRI), where the robot is learning to classify some set of inputs while the human teaches it by providing only binary feedback—or sometimes even the wrong answer entirely.
Experimental results in the HRI setting and with two benchmark

datasets from other settings show that UCWL outperforms other state-of-the-art algorithms in the online binary feedback setting—and surprisingly even sometimes outperforms state-of-the-art algorithms
that get full feedback (e.g., the true class label) while UCWL gets only binary feedback on the same data
sequence.

UCWL combines the Upper Confidence Bound (UCB) framework with the Soft Confidence Weighted (SCW) online learning scheme. In UCB, each instance is classified using both score and uncertainty.

For a given instance in the sequence, the algorithm might guess its class label primarily to reduce the class uncertainty.

This is a form of informed exploration, which enables the performance to improve with lower sample complexity compared with the case without exploration.

Combining UCB with SCW leads to the ability to deal well with noisy and non-separable data, and state-of-the-art performance is achieved without increasing the computational cost. A potential application setting is human-robot interaction (HRI), where the robot is learning to classify some set of inputs while the human teaches it by providing only binary feedback—or sometimes even the wrong answer entirely.
Experimental results in the HRI setting and with two benchmark

datasets from other settings show that UCWL outperforms other state-of-the-art algorithms in the online binary feedback setting—and surprisingly even sometimes outperforms state-of-the-art algorithms
that get full feedback (e.g., the true class label) while UCWL gets only binary feedback on the same data
sequence.

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

เราแนะนำอัลกอริทึมนวนิยายเรียกบนความเชื่อมั่นถ่วงน้ำหนักเรียนรู้ (UCWL) สำหรับ multiclass ออนไลน์เรียนรู้จากความคิดเห็นไบนารี (เช่น ความคิดเห็นที่บ่งชี้ว่า คำทำนายถูกต้อง หรือไม่ถูกต้อง)UCWL รวมกรอบผูกความเชื่อมั่นของด้านบน (UCB) กับแผนการเรียนแบบออนไลน์ถ่วงน้ำหนักความเชื่อมั่นของนุ่ม (SCW) ใน UCB แต่ละอินสแตนซ์ถูกจัดประเภทโดยใช้คะแนนและความไม่แน่นอน สำหรับอินสแตนซ์ที่ระบุในลำดับ อัลกอริทึมอาจเดาป้ายชื่อเพื่อลดความไม่แน่นอนระดับชั้นของแบบฟอร์มสำรวจทราบ ซึ่งช่วยให้ประสิทธิภาพในการปรับปรุง มีความซับซ้อนอย่างต่ำเมื่อเทียบกับกรณีไม่มีการสำรวจ อยู่ รวม UCB กับ SCW นำไปสู่ความสามารถในการจัดการกับข้อมูลเสียงดัง และไม่ใช่ separable และประสิทธิภาพของทันสมัยสามารถทำได้โดยไม่ต้องเพิ่มต้นทุนคำนวณ การตั้งค่าโปรแกรมประยุกต์อาจถูกโต้ตอบมนุษย์หุ่นยนต์ (HRI), ที่หุ่นยนต์เรียนรู้การจัดประเภทบางชุดของอินพุตในขณะที่มนุษย์สอน โดยให้ผลป้อนกลับแบบไบนารีเท่านั้น — หรือบางครั้งแม้แต่คำตอบไม่ถูกต้องทั้งหมดผลการทดลองการ HRI และสองมาตรฐานdatasets จากการตั้งค่าอื่น ๆ แสดงว่า UCWL outperforms อัลกอริทึมอื่น ๆ สถานะของศิลปะในการตั้งค่าผลป้อนกลับนารีออนไลน์ — และแม้จู่ ๆ บางครั้ง outperforms สมัยของอัลกอริทึมที่ได้รับคำติชมทั้งหมด (เช่น ป้ายจริงชั้น) ในขณะที่ UCWL ได้รับคำติชมเท่านั้นไบนารีบนข้อมูลเดียวกันลำดับนั้น

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

เราแนะนำขั้นตอนวิธีการที่เรียกว่านวนิยายเรื่องความเชื่อมั่นบนถ่วงน้ำหนักการเรียนรู้ (UCWL) สำหรับการเรียนรู้ออนไลน์ multiclass จากความคิดเห็นของไบนารี (เช่นข้อเสนอแนะที่บ่งชี้ว่าการคาดการณ์ที่ถูกต้องหรือผิด). UCWL รวมความเชื่อมั่น Upper Bound (UCB) กรอบกับความเชื่อมั่น Soft ถ่วงน้ำหนัก (SCW) โครงการการเรียนรู้ออนไลน์ ใน UCB อินสแตนซ์แต่ละคนจะจัดใช้ทั้งคะแนนและความไม่แน่นอน. ยกตัวอย่างเช่นให้ในลำดับขั้นตอนวิธีอาจเดาฉลากระดับนี้เป็นหลักในการลดความไม่แน่นอนในชั้นเรียน. นี้เป็นรูปแบบของการสำรวจทราบซึ่งจะช่วยให้ผลการดำเนินงานในการปรับปรุงด้วย ความซับซ้อนตัวอย่างที่ต่ำกว่าเมื่อเทียบกับกรณีที่ไม่มีการสำรวจ. รวม UCB กับ SCW นำไปสู่ความสามารถในการจัดการได้ดีกับข้อมูลที่มีเสียงดังและไม่แยกและรัฐของศิลปะประสิทธิภาพการทำงานจะประสบความสำเร็จโดยไม่ต้องเพิ่มค่าใช้จ่ายในการคำนวณ การตั้งค่าแอพลิเคชันที่มีศักยภาพเป็นปฏิสัมพันธ์ระหว่างมนุษย์และหุ่นยนต์ (HRI) ซึ่งหุ่นยนต์คือการเรียนรู้ที่จะจัดบางชุดของปัจจัยการผลิตในขณะที่มนุษย์สอนได้โดยการให้เพียงข้อเสนอแนะหรือไบนารีแม้บางครั้งคำตอบที่ผิดอย่างสิ้นเชิง. ผลการทดลองในการตั้งค่าและ HRI มีสองมาตรฐานชุดข้อมูลจากการตั้งค่าอื่น ๆ ที่แสดงให้เห็นว่ามีประสิทธิภาพดีกว่า UCWL กลไกอื่น ๆ ในรัฐของศิลปะในการตอบรับไบนารีออนไลน์การตั้งค่าและน่าแปลกใจที่แม้บางครั้งมีประสิทธิภาพดีกว่าอัลกอริทึมรัฐของศิลปะที่ได้รับการตอบรับอย่างเต็มรูปแบบ (เช่นชั้นเรียนจริง ฉลาก) ในขณะที่ UCWL ได้รับเพียงข้อเสนอแนะไบนารีข้อมูลเดียวกันลำดับ

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

เราแนะนำนิยายขั้นตอนวิธีเรียกบนความเชื่อมั่นหนักเรียน ( ucwl ) สำหรับการเรียนรู้ออนไลน์หลายความคิดเห็นจากไบนารี ( เช่น ข้อมูลที่บ่งชี้ว่า ทำนายถูกหรือผิด )

ucwl รวมบนความมั่นใจจำกัด ( UCB ) กรอบนุ่มมั่นใจถ่วงน้ำหนัก ( scw ) การเรียนรู้แบบออนไลน์ ในตัวอย่างจะใช้ UCB แต่ละประเภททั้งคะแนนและความไม่แน่นอน

ให้อินสแตนซ์ในลำดับขั้นตอนวิธีอาจคาดเดาป้ายชื่อคลาสหลักที่จะลดระดับความไม่แน่นอน

นี่เป็นรูปแบบของข้อมูลการสำรวจ , ซึ่งจะช่วยให้ประสิทธิภาพดีขึ้นลดความซับซ้อนเมื่อเทียบกับตัวอย่างกรณีไม่มีการสำรวจ

รวม UCB ด้วย scw นำไปสู่ความสามารถในการจัดการกับข้อมูลที่ไม่ใช่แยกกันและเสียงดัง ,และประสิทธิภาพของรัฐ - of - the - art ได้โดยไม่ต้องเพิ่มค่าใช้จ่ายในการคำนวณ การตั้งค่าโปรแกรมที่มีศักยภาพเป็นปฏิสัมพันธ์ของมนุษย์หุ่นยนต์ ( HRI ) ซึ่งหุ่นยนต์คือการเรียนรู้ที่จะจัดบางชุดของปัจจัยการผลิต ในขณะที่มนุษย์สอนโดยให้เพียงข้อมูลไบนารีหรือแม้บางครั้งตอบผิดทั้งหมด .
1 ในเพลง และตั้งค่าด้วยสองมาตรฐาน

ข้อมูลจากการตั้งค่าอื่น ๆแสดงให้เห็นว่า ucwl มีประสิทธิภาพดีกว่าขั้นตอนวิธีรัฐ - of - the - art อื่นในออนไลน์ไบนารีติชมการตั้งค่า และจู่ ๆแม้บางครั้งมีประสิทธิภาพดีกว่ารัฐ - of - the - art ขั้นตอนวิธี
ที่ได้รับเต็มรูปแบบการตอบรับ ( เช่น จริงเรียนป้ายชื่อ ) ในขณะที่ ucwl รับไบนารีข้อมูลเกี่ยวกับลำดับข้อมูล

เหมือนกัน

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.