To solve the problem of different t

To solve the problem of different term distribution between the training and test data in CLSC, some researchers tried to
incorporate unlabelled data from the target language by using semi-supervised learning approach [10,11,33]. As an example,
Wan [33] used the co-training method to overcome the problem of cross-lingual sentiment classification. He exploited a
bilingual co-training approach to leverage annotated English language resources to sentiment classification in Chinese language
reviews. In that work, firstly, machine translation services were used to translate English labelled documents (training
documents) into Chinese and similarly, to translate Chinese unlabelled documents into English. The author used two different
views (English and Chinese) in order to exploit the co-training approach to the classification problem. The selection strategy
of semi-supervised learning usually selects high confidence examples to add to the training data. However, if the initial
classifiers are not good enough, there will be an increased probability of adding examples having incorrect labels in the training
set. Therefore, the addition of noisy examples not only cannot increase the accuracy of the learning model, but will also
gradually decrease the performance of each classifier. Furthermore, the most confident classified examples are not necessarily
the most informative ones in the learning process. Therefore, adding these examples may not be very useful from the classification
viewpoint. Considering these problems, the use of active learning with semi-supervised learning is considered in
this paper in order to select most informative examples from unlabelled document along with most confident classified unlabelled
examples to enrich the training data.

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

เพื่อแก้ปัญหาการกระจายระยะแตกต่างกันระหว่างการฝึกอบรมและทดสอบข้อมูลใน CLSC บางนักวิจัยพยายามรวมข้อมูล unlabelled จากภาษาเป้าหมาย โดยใช้วิธีการเรียนรู้กึ่งมี [10,11,33] เป็นตัวอย่างหวาน [33] ใช้วิธีร่วมฝึกเพื่อเอาชนะปัญหาของการจัดประเภทความเชื่อมั่นโดยข้าม เขาสามารถเป็นสองภาษาร่วมฝึกอบรมวิธีการใช้ใส่คำอธิบายประกอบทรัพยากรภาษาอังกฤษเพื่อจัดประเภทความเชื่อมั่นในภาษาจีนรีวิว ในที่ทำงาน แรก บริการแปลภาษาด้วยเครื่องใช้ในการแปลมันเอกสาร (ฝึกภาษาอังกฤษเอกสาร) เป็นภาษาจีน และในทำนองเดียว กัน การแปล unlabelled เอกสารเป็นภาษาอังกฤษภาษาจีน ผู้เขียนใช้สองแตกต่างกันมุมมอง (ภาษาอังกฤษและจีน) เพื่อใช้วิธีการฝึกอบรมร่วมปัญหาจัดประเภท กลยุทธ์เลือกการกึ่งมีเรียนรู้มักจะเลือกความมั่นใจสูงอย่างการเพิ่มข้อมูลการฝึกอบรม อย่างไรก็ตาม ถ้าต้นคำนามภาษาไม่ดีพอ จะมีการเพิ่มขึ้นน่าเพิ่มตัวอย่างที่มีฉลากไม่ถูกต้องในการฝึกตั้งค่า ดังนั้น แห่งตัวอย่างเสียงดังไม่เพียงแต่ไม่สามารถเพิ่มความแม่นยำของแบบจำลองการเรียนรู้ แต่จะค่อย ๆ ลดประสิทธิภาพการทำงานของแต่ละ classifier นอกจากนี้ ตัวอย่างลับที่สุดมั่นใจไม่จำเป็นต้องคนอีกมากที่สุดในกระบวนการเรียนรู้ ดังนั้น เพิ่มตัวอย่างเหล่านี้อาจไม่เป็นประโยชน์อย่างมากจากการจัดประเภทจุดชมวิว พิจารณาปัญหาเหล่านี้ การใช้งานการเรียนรู้ด้วยการเรียนรู้กึ่งมีกำลังในเอกสารนี้เพื่อเลือกตัวอย่างข้อมูลส่วนใหญ่จาก unlabelled เอกสารพร้อมที่สุดมั่นใจลับ unlabelledตัวอย่างการเพิ่มข้อมูลการฝึกอบรม

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

เพื่อแก้ปัญหาของการกระจายในระยะที่แตกต่างกันระหว่างการฝึกอบรมและการทดสอบข้อมูลใน CLSC
ที่นักวิจัยบางคนพยายามที่จะรวมข้อมูลจากการปิดฉลากภาษาเป้าหมายโดยใช้วิธีการเรียนรู้แบบกึ่งดูแล[10,11,33] ตัวอย่างเช่นวัน [33] ใช้วิธีการร่วมการฝึกอบรมที่จะเอาชนะปัญหาของการจำแนกความเชื่อมั่นข้ามลิ้น เขาใช้ประโยชน์วิธีการร่วมการฝึกอบรมภาษาเพื่อใช้ประโยชน์จากทรัพยากรข้อเขียนภาษาอังกฤษเพื่อการจัดหมวดหมู่ความเชื่อมั่นในภาษาจีนความคิดเห็น ในการทำงานที่แรก, บริการแปลภาษาเครื่องถูกใช้ในการแปลเอกสารที่มีข้อความภาษาอังกฤษ (การฝึกอบรมเอกสาร) ลงในจีนและในทำนองเดียวกันในการแปลเอกสารการปิดฉลากภาษาจีนเป็นภาษาอังกฤษ ผู้เขียนใช้ที่แตกต่างกันสองมุมมอง (ภาษาอังกฤษและภาษาจีน) เพื่อใช้ประโยชน์จากวิธีการร่วมการฝึกอบรมในการแก้ไขปัญหาการจัดหมวดหมู่ กลยุทธ์การเลือกของการเรียนรู้กึ่งดูแลมักจะเลือกตัวอย่างความเชื่อมั่นสูงในการเพิ่มข้อมูลการฝึกอบรม แต่ถ้าเริ่มต้นแยกแยะไม่ได้ดีพอที่จะมีน่าจะเป็นที่เพิ่มขึ้นของการเพิ่มตัวอย่างที่มีฉลากไม่ถูกต้องในการฝึกอบรมชุด ดังนั้นนอกเหนือจากตัวอย่างที่มีเสียงดังไม่เพียง แต่ไม่สามารถเพิ่มความถูกต้องของรูปแบบการเรียนรู้ แต่จะยังค่อยๆลดประสิทธิภาพการทำงานของแต่ละลักษณนาม นอกจากนี้ตัวอย่างจำแนกที่สุดมั่นใจไม่จำเป็นต้องมีคนที่ให้ข้อมูลมากที่สุดในกระบวนการเรียนรู้ ดังนั้นการเพิ่มตัวอย่างเหล่านี้อาจจะไม่ได้ประโยชน์อย่างมากจากการจัดมุมมอง พิจารณาปัญหาเหล่านี้ใช้ในการเรียนรู้การใช้งานกับการเรียนรู้กึ่งภายใต้การดูแลที่มีการพิจารณาในบทความนี้เพื่อเลือกตัวอย่างข้อมูลมากที่สุดจากเอกสารการปิดฉลากพร้อมกับความมั่นใจมากที่สุดจัดป้ายกำกับตัวอย่างเพื่อเพิ่มข้อมูลการฝึกอบรม

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.