In recent years, research in sentim

In recent years, research in sentiment classification has received considerable attention by
natural language processing researchers. Annotated sentiment corpora are the most important
resources used in sentiment classification. However, since most recent research works
in this field have focused on the English language, there are accordingly not enough annotated
sentiment resources in other languages. Manual construction of reliable annotated
sentiment corpora for a new language is a labour-intensive and time-consuming task.
Projection of sentiment corpus from one language into another language is a natural solution
used in cross-lingual sentiment classification. Automatic machine translation services
are the most commonly tools used to directly project information from one language into
another. However, since term distribution across languages may be different due to variations
in linguistic terms and writing styles, cross-lingual methods cannot reach the performance
of monolingual methods. In this paper, a novel learning model is proposed based on
the combination of uncertainty-based active learning and semi-supervised self-training
approaches to incorporate unlabelled sentiment documents from the target language in
order to improve the performance of cross-lingual methods. Further, in this model, the
density measures of unlabelled examples are considered in active learning part in order
to avoid outlier selection. The empirical evaluation on book review datasets in three different
languages shows that the proposed model can significantly improve the performance of
cross-lingual sentiment classification in comparison with other existing and baseline
methods.

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

ในปีที่ผ่านมา การวิจัยในการจัดประเภทความเชื่อมั่นได้รับความสนใจมากจากนักวิจัยการประมวลผลภาษาธรรมชาติ ความเชื่อมั่นประกอบ corpora สำคัญสุดทรัพยากรที่ใช้ในการจัดประเภทความเชื่อมั่น อย่างไรก็ตาม เนื่องจากงานวิจัยล่าสุดในฟิลด์นี้ได้เน้นในภาษาอังกฤษ มีตามไม่พอใส่คำอธิบายประกอบทรัพยากรความเชื่อมั่นในภาษาอื่น ใส่คำอธิบายประกอบด้วยตนเองสร้างความน่าเชื่อถือความเชื่อมั่น corpora ภาษาใหม่เป็นงานที่แรงงานมาก และใช้เวลานานการณ์ความเชื่อมั่นคอร์พัสคริจากภาษาหนึ่งเป็นภาษาอื่นคือ โซลูชันที่ธรรมชาติใช้ในการจัดประเภทความเชื่อมั่นโดยข้าม บริการแปลภาษาด้วยเครื่องอัตโนมัติมีมากสุดโดยทั่วไปเครื่องมือข้อมูลโครงการที่ใช้โดยตรงจากภาษาหนึ่งเป็นอื่น อย่างไรก็ตาม ตั้งแต่ระยะ กระจายข้ามภาษาอาจแตกต่างจากรูปแบบในภาษาศาสตร์เงื่อนไขและรูปแบบการเขียน วิธีข้ามโดยไม่สามารถเข้าถึงประสิทธิภาพการทำงานวิธี monolingual ในเอกสารนี้ แบบเรียนนวนิยายจะเสนอตามเรียนรู้งานจากความไม่แน่นอนและกึ่งมีตนเองการฝึกอบรมวิธีการรวมเอกสารความเชื่อมั่น unlabelled จากภาษาเป้าหมายในสั่งปรับปรุงประสิทธิภาพของวิธีการโดยข้าม เพิ่มเติม ในรูปแบบนี้ การวัดความหนาแน่นของตัวอย่าง unlabelled จะพิจารณาในส่วนเรียนรู้งานในใบสั่งเพื่อหลีกเลี่ยงการเลือก outlier การประเมินผลบน datasets ตรวจทานสมุดในสามแตกต่างกันภาษาแสดงว่า แบบจำลองที่นำเสนอสามารถอย่างมีนัยสำคัญเพิ่มประสิทธิภาพของความเชื่อมั่นโดยข้ามประเภทเมื่อเปรียบเทียบกับอื่น ๆ ที่มีอยู่และพื้นฐานวิธี

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

ในปีที่ผ่านการวิจัยในการจำแนกความเชื่อมั่นได้รับความสนใจอย่างมากจากนักวิจัยประมวลผลภาษาธรรมชาติ
คลังความเชื่อมั่นของข้อเขียนที่สำคัญที่สุดทรัพยากรที่ใช้ในการจำแนกความเชื่อมั่น แต่เนื่องจากผลงานวิจัยล่าสุดในด้านนี้มีความสำคัญกับการใช้ภาษาอังกฤษมีไม่เพียงพอตามข้อเขียนทรัพยากรความเชื่อมั่นในภาษาอื่นๆ ก่อสร้างด้วยตนเองของข้อเขียนที่น่าเชื่อถือคลังความเชื่อมั่นสำหรับภาษาใหม่เป็นแรงงานมากและใช้เวลานานงาน. ประมาณการคลังความเชื่อมั่นจากภาษาหนึ่งเป็นภาษาอื่นเป็นวิธีธรรมชาติที่ใช้ในการจำแนกความเชื่อมั่นข้ามภาษา บริการแปลภาษาเครื่องอัตโนมัติจะมากที่สุดเครื่องมือที่ใช้ในการโครงการโดยตรงข้อมูลจากภาษาหนึ่งเข้าไปอีก แต่เนื่องจากระยะการกระจายทั่วภาษาอาจจะแตกต่างกันเนื่องจากการเปลี่ยนแปลงในแง่ภาษาและรูปแบบการเขียนวิธีการข้ามภาษาไม่สามารถเข้าถึงประสิทธิภาพของวิธีการเดียว ในบทความนี้เป็นรูปแบบการเรียนรู้นวนิยายมีการเสนอขึ้นอยู่กับการรวมกันของการเรียนรู้การใช้งานตามความไม่แน่นอนและกึ่งฝึกอบรมภายใต้การดูแลตัวเองวิธีการรวมเอกสารความเชื่อมั่นจากการปิดฉลากภาษาเป้าหมายในการสั่งซื้อเพื่อปรับปรุงประสิทธิภาพของวิธีการข้ามลิ้น นอกจากนี้ในรุ่นนี้ที่มาตรการความหนาแน่นของตัวอย่างป้ายกำกับได้รับการพิจารณาในส่วนของการเรียนรู้การใช้งานในการสั่งซื้อเพื่อหลีกเลี่ยงการเลือกค่าผิดปกติ การประเมินผลการทดลองในชุดข้อมูลหนังสือทบทวนในสามที่แตกต่างกันภาษาแสดงให้เห็นว่ารูปแบบที่นำเสนออย่างมีนัยสำคัญสามารถปรับปรุงประสิทธิภาพของการจัดหมวดหมู่ความเชื่อมั่นข้ามภาษาในการเปรียบเทียบกับพื้นฐานที่มีอยู่และอื่นๆวิธีการ

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.