Most of the world languages are resource-poor for statistical machine  การแปล - Most of the world languages are resource-poor for statistical machine  ไทย วิธีการพูด

Most of the world languages are res

Most of the world languages are resource-poor for statistical machine translation; still, many of them are actually related to some resource-rich language. Thus, we propose three novel, language-independent approaches to source language adaptation for resource-poor statistical machine translation. Specifically, we build improved statistical machine translation models from a resource-poor language POOR into a target language TGT by adapting and using a large bitext for a related resource-rich language RICH and the same target language TGT. We assume a small POOR–TGT bitext from which we learn word-level and phrase-level paraphrases and cross-lingual morphological variants between the resource-rich and the resource-poor language. Our work is of importance for resource-poor machine translation since it can provide a useful guideline for people building machine translation systems for resource-poor languages.

Our experiments for Indonesian/Malay–English translation show that using the large adapted resource-rich bitext yields 7.26 BLEU points of improvement over the unadapted one and 3.09 BLEU points over the original small bitext. Moreover, combining the small POOR–TGT bitext with the adapted bitext outperforms the corresponding combinations with the unadapted bitext by 1.93–3.25 BLEU points. We also demonstrate the applicability of our approaches to other languages and domains.
0/5000
จาก: -
เป็น: -
ผลลัพธ์ (ไทย) 1: [สำเนา]
คัดลอก!
ภาษาโลกส่วนใหญ่จะยากจนสำหรับสถิติการแปลภาษาด้วยเครื่อง ยัง หลายคนเป็นจริงเกี่ยวข้องกับภาษาที่อุดมไปด้วยทรัพยากรบาง ดังนั้น เรานำเสนอแนวทางสามนวนิยาย อิสระภาษาการปรับตัวภาษาต้นฉบับยากจนสถิติเครื่องแปล เฉพาะ เราสร้างรุ่นปรับปรุงสถิติเครื่องแปลภาษายากจนยากจนลงในภาษาเป้าหมาย TGT โดยปรับตัว และใช้ bitext ที่มีขนาดใหญ่สำหรับภาษาที่อุดมไปด้วยทรัพยากรที่เกี่ยวข้องรวยและภาษาเป้าหมายเดียวกัน TGT. เราถือว่าเป็น bitext ยากจน – TGT เล็กที่เราเรียนรู้ paraphrases ระดับคำ และ ระดับวลีและตัวแปรสัณฐานข้ามภาษาระหว่างภาษายากจนและอุดมไปด้วยทรัพยากร งานของเรามีความสำคัญสำหรับการแปลเครื่องยากจนเนื่องจากมันสามารถให้แนวทางที่เป็นประโยชน์สำหรับคนสร้างระบบเครื่องแปลภาษายากจนการทดลองของเราสำหรับอินโดนีเซียมาเลย์ – ภาษาอังกฤษแปลว่าใช้ bitext ที่อุดมไปด้วยทรัพยากรปรับใหญ่ 7.26 เบลอจุดปรับปรุงมากกว่าหนึ่ง unadapted และ 3.09 เบลอจุดผ่าน bitext เล็กเดิม นอกจากนี้ รวม bitext คนจน – TGT เล็กกับ bitext ดัดแปลงมีประสิทธิภาพสูงกว่าชุดที่ที่สอดคล้องกับ unadapted bitext 1.93 – 3.25 เบลอจุด นอกจากนี้เรายังแสดงถึงความเกี่ยวข้องของเราวิธีการอื่น ๆ ภาษาและโดเมน
การแปล กรุณารอสักครู่..
ผลลัพธ์ (ไทย) 2:[สำเนา]
คัดลอก!
ส่วนใหญ่เป็นภาษาโลกมีทรัพยากรที่ดีสำหรับเครื่องแปลภาษาทางสถิติ ยังคงมากของพวกเขามีความเกี่ยวข้องจริงภาษาอุดมไปด้วยทรัพยากรบางอย่าง ดังนั้นเราจึงนำเสนอสามนวนิยายวิธีภาษาอิสระกับแหล่งที่มาภาษาสำหรับการปรับตัวที่ยากจนเครื่องแปลภาษาเชิงสถิติ โดยเฉพาะการที่เราสร้างแบบจำลองทางสถิติที่ดีขึ้นเครื่องแปลภาษาจากภาษาทรัพยากรคนจนเป็น TGT ภาษาเป้าหมายโดยการปรับและการใช้ Bitext ขนาดใหญ่สำหรับภาษาที่อุดมไปด้วยทรัพยากรที่เกี่ยวข้องกับคนรวยและภาษาเป้าหมายเดียวกัน TGT เราคิดเล็ก ๆ ยากจน TGT Bitext จากการที่เราได้เรียนรู้คำและวลีที่ระดับระดับ paraphrases และข้ามภาษาพันธุ์ก้านระหว่างอุดมไปด้วยทรัพยากรและภาษาทรัพยากรยากจน การทำงานของเรามีความสำคัญสำหรับทรัพยากรยากจนเครื่องแปลภาษาเพราะสามารถให้แนวทางที่เป็นประโยชน์สำหรับคนที่สร้างระบบเครื่องแปลภาษาสำหรับภาษาที่ยากจน. การทดลองของเราสำหรับอินโดนีเซียแสดงการแปล / มลายูภาษาอังกฤษที่ใช้ขนาดใหญ่อัตราผลตอบแทน Bitext อุดมไปด้วยทรัพยากรดัดแปลง 7.26 จุดเบลอของการปรับปรุงมากกว่า unadapted หนึ่งและ 3.09 จุด BLEU กว่าเดิม Bitext ขนาดเล็ก นอกจากนี้การรวมขนาดเล็กยากจน TGT Bitext กับ Bitext ดัดแปลงมีประสิทธิภาพดีกว่าชุดที่สอดคล้องกับ Bitext unadapted โดย 1.93-3.25 จุด BLEU นอกจากนี้เรายังแสดงให้เห็นถึงการบังคับใช้ของวิธีการของเรากับภาษาอื่น ๆ และโดเมน

การแปล กรุณารอสักครู่..
ผลลัพธ์ (ไทย) 3:[สำเนา]
คัดลอก!
ที่สุดของโลกภาษาเป็นทรัพยากรที่ไม่ดีสำหรับเครื่องแปลภาษาเชิงสถิติ ยังคงมากของพวกเขาเป็นจริงที่เกี่ยวข้องกับบางทรัพยากรที่อุดมไปด้วยภาษา ดังนั้นเราจึงเสนอสามนวนิยายภาษาแนวอิสระแหล่งทรัพยากรทางภาษาการปรับตัวไม่ดี เครื่องแปลภาษา โดยเฉพาะ เราสร้างสถิติแปลรุ่นปรับปรุงเครื่องจากทรัพยากรจนภาษาไม่ดีในภาษาเป้าหมายแบบกลุ่ม โดยเลือกใช้ bitext ขนาดใหญ่สำหรับทรัพยากรที่เกี่ยวข้อง รวย รวย และภาษาเดียวกันภาษาเป้าหมายแบบกลุ่ม . เราถือว่าเล็กและยากจน TGT bitext จากที่เราได้เรียนรู้ในระดับคำและระดับวลีและตัวแปรทางด้าน paraphrases ข้ามระหว่างทรัพยากรที่อุดมไปด้วยทรัพยากรที่ยากจนและภาษา งานของเราคือความสำคัญของทรัพยากรจนเครื่องแปลตั้งแต่มันสามารถให้แนวทางที่เป็นประโยชน์สำหรับคนเครื่องสร้างระบบการแปลทรัพยากรจนภาษาการทดลองของเรา ภาษาไทย / มลายู–แปลภาษาอังกฤษแสดงให้เห็นว่าการใช้ขนาดใหญ่ดัดแปลงทรัพยากรอุดมไปด้วย bitext ผลผลิต 7.26 เบลอจุดของการปรับปรุงผ่าน unadapted และ 3.09 เบลอจุดเหนือ bitext เล็กเดิม นอกจากนี้ การรวมขนาดเล็กที่ไม่ดี– TGT bitext กับดัดแปลง bitext มีประสิทธิภาพดีกว่าชุดสอดคล้องกับ bitext unadapted โดย 1.93 เบลอ– 3.25 จุด นอกจากนี้เรายังแสดงให้เห็นถึงการประยุกต์ใช้วิธีการของเราในภาษาอื่น ๆและโดเมน
การแปล กรุณารอสักครู่..
 
ภาษาอื่น ๆ
การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.

Copyright ©2025 I Love Translation. All reserved.

E-mail: