6.2. Speech translationAn important pioneering work proposed by Schult การแปล - 6.2. Speech translationAn important pioneering work proposed by Schult ไทย วิธีการพูด

6.2. Speech translationAn important

6.2. Speech translation
An important pioneering work proposed by Schultz
et al. (2004) was an English–Thai speech-to-speech translation
system in the medical diagnosis domain. The paper
described a two-way speech-to-speech translation system
between Thai and English for dialogues in the limited
medical domain, where the English speaker was a doctor
and the Thai speaker was a patient. The system consisted
of three major parts, speech recognition, language translation,
and speech synthesis. A Thai speech recognizer was
built using a seed multi-lingual acoustic model and
retrained by the hotel reservation speech utterances taken
from the NECTEC-ATR speech corpus, disregarding tone
information. The lexicon used for ASR contained 734
words in the medical diagnosis domain. The recognizer,
which had been evaluated with speech utterances from
the same domain, achieved 85% word accuracy. For language
translation, text in the source language was parsed
and converted to an interlingua via machine translation
using the Interchange Format (IF), and target-language
sentences were generated from the parsed result. The IF
was customized to cope with Thai syntax. Three Thaispecific
characteristics were addressed in the IF; the use
of a special term to indicate the gender of a person, affirmation
expressions having meanings other than simply ‘‘yes’’,
and the separation of words from the main verb to indicate
feasibility and other modalities. To generate Thai sentences,
manually written semantic/syntactic grammars
and lexicons were employed. In the Thai speech synthesizer,
a limited-domain Festival system covering 522 words
was created. It contained 235 sentences selected from the
hotel reservation part of the NECTEC-ATR corpus (Black
and Lenzo, 2000). A year later, a particular investigation to
improve the ASR part of the system was made (Suebvisai
et al., 2005). An optimized ASR module was acoustically
trained with a joint set which comprised the Thai GlobalPhone
corpus and Thai Babylon Medical-domain corpus.
Rather than a single pronunciation dictionary, a multivariant
dictionary was created using simple rules such as
omitting the difference between /l/ and /r/. Incorporating
tone features into ASR gave no clear improvement. The
best ASR module achieved 18.2% word error rate.
0/5000
จาก: -
เป็น: -
ผลลัพธ์ (ไทย) 1: [สำเนา]
คัดลอก!
6.2. Speech translationAn important pioneering work proposed by Schultzet al. (2004) was an English–Thai speech-to-speech translationsystem in the medical diagnosis domain. The paperdescribed a two-way speech-to-speech translation systembetween Thai and English for dialogues in the limitedmedical domain, where the English speaker was a doctorand the Thai speaker was a patient. The system consistedof three major parts, speech recognition, language translation,and speech synthesis. A Thai speech recognizer wasbuilt using a seed multi-lingual acoustic model andretrained by the hotel reservation speech utterances takenfrom the NECTEC-ATR speech corpus, disregarding toneinformation. The lexicon used for ASR contained 734words in the medical diagnosis domain. The recognizer,which had been evaluated with speech utterances fromthe same domain, achieved 85% word accuracy. For languagetranslation, text in the source language was parsedand converted to an interlingua via machine translationusing the Interchange Format (IF), and target-languagesentences were generated from the parsed result. The IFwas customized to cope with Thai syntax. Three Thaispecificcharacteristics were addressed in the IF; the useof a special term to indicate the gender of a person, affirmationexpressions having meanings other than simply ‘‘yes’’,and the separation of words from the main verb to indicatefeasibility and other modalities. To generate Thai sentences,manually written semantic/syntactic grammarsand lexicons were employed. In the Thai speech synthesizer,a limited-domain Festival system covering 522 wordswas created. It contained 235 sentences selected from thehotel reservation part of the NECTEC-ATR corpus (Blackand Lenzo, 2000). A year later, a particular investigation toimprove the ASR part of the system was made (Suebvisaiet al., 2005). An optimized ASR module was acousticallytrained with a joint set which comprised the Thai GlobalPhonecorpus and Thai Babylon Medical-domain corpus.Rather than a single pronunciation dictionary, a multivariantdictionary was created using simple rules such asomitting the difference between /l/ and /r/. Incorporatingtone features into ASR gave no clear improvement. Thebest ASR module achieved 18.2% word error rate.
การแปล กรุณารอสักครู่..
ผลลัพธ์ (ไทย) 2:[สำเนา]
คัดลอก!
6.2 แปลคำพูดของงานที่เป็นผู้บุกเบิกที่สำคัญที่เสนอโดยชูลท์ซและอัล (2004) เป็นภาษาอังกฤษเป็นภาษาไทยคำพูดเป็นคำพูดแปลระบบในโดเมนการวินิจฉัยทางการแพทย์ กระดาษที่อธิบายไว้สองทางคำพูดเป็นคำพูดระบบการแปลระหว่างภาษาไทยและภาษาอังกฤษเพื่อหารือในที่จำกัดโดเมนทางการแพทย์ที่พูดภาษาอังกฤษเป็นหมอและลำโพงไทยเป็นผู้ป่วย ระบบประกอบด้วยสามส่วนใหญ่รู้จำเสียงพูด, การแปลภาษาและการสังเคราะห์เสียงพูด รู้จำเสียงพูดภาษาไทยได้ถูกสร้างขึ้นโดยใช้เมล็ดรูปแบบอะคูสติกได้หลายภาษาและการฝึกอบรมจากคำพูดคำพูดการจองโรงแรมที่นำมาจากคำพูดของเนคเทคคอร์ปัสATR-ไม่คำนึงถึงเสียงข้อมูล ศัพท์ที่ใช้สำหรับ ASR มี 734 คำในโดเมนการวินิจฉัยทางการแพทย์ จำแนก, ซึ่งได้รับการประเมินด้วยคำพูดคำพูดจากโดเมนเดียวกันประสบความสำเร็จในความถูกต้องของคำว่า 85% สำหรับภาษาแปลข้อความในภาษาต้นฉบับที่ถูกแยกและแปลงนานาชาติผ่านเครื่องแปลภาษาโดยใช้รูปแบบการแลกเปลี่ยน(IF) และเป้าหมายภาษาประโยคที่ถูกสร้างขึ้นจากผลการแยกวิเคราะห์ ถ้าได้รับการปรับแต่งเพื่อให้รับมือกับไวยากรณ์ไทย สาม Thaispecific ลักษณะถูกแก้ไขใน IF; การใช้งานของคำพิเศษเพื่อบ่งชี้ถึงเพศของบุคคลที่ยืนยันการแสดงออกที่มีความหมายอื่นที่ไม่ใช่เพียง'' ใช่ '', และการแยกของคำจากคำกริยาหลักที่จะบ่งบอกถึงความเป็นไปได้และรังสีอื่น ๆ เพื่อสร้างประโยคภาษาไทยที่เขียนด้วยตนเองไวยากรณ์ความหมาย / ประโยคและคำศัพท์ที่ถูกว่าจ้าง ในการสังเคราะห์เสียงพูดภาษาไทย, ระบบเทศกาล จำกัด โดเมนครอบคลุม 522 คำที่ถูกสร้างขึ้น มันมี 235 ประโยคเลือกจากส่วนการจองโรงแรมของเนคเทคคอร์ปัส-ATR (สีดำและ Lenzo, 2000) หนึ่งปีต่อมาการสืบสวนโดยเฉพาะอย่างยิ่งในการปรับปรุงส่วน ASR ระบบที่ถูกสร้างขึ้น (Suebvisai et al., 2005) โมดูล ASR ที่ดีที่สุดได้รับเสียงผ่านการฝึกอบรมกับชุดทุนซึ่งประกอบด้วยGlobalPhone ไทยคอร์ปัสไทยและบาบิโลนคลังแพทย์โดเมน. แทนที่จะพจนานุกรมการออกเสียงเดียว multivariant พจนานุกรมที่ถูกสร้างขึ้นโดยใช้กฎง่ายๆเช่นถนัดแตกต่างระหว่าง / ลิตร / และ / R / ผสมผสานคุณสมบัติเสียงเข้า ASR ไม่มีการปรับปรุงให้ชัดเจน โมดูล ASR ประสบความสำเร็จที่ดีที่สุดคำว่าอัตราความผิดพลาด 18.2%








































การแปล กรุณารอสักครู่..
ผลลัพธ์ (ไทย) 3:[สำเนา]
คัดลอก!
6.2 . การแปลสุนทรพจน์
ที่สำคัญงานบุกเบิกที่เสนอโดย Schultz
et al . ( 2004 ) เป็นภาษาอังกฤษ–ไทยพูดกับระบบการแปล
การพูดในการวินิจฉัยทางการแพทย์โดเมน กระดาษ


พูดอธิบายแบบสองทางระบบการแปลคำพูดระหว่างภาษาไทยและภาษาอังกฤษบทสนทนาในการวิเคราะห์ทางการแพทย์จำกัด
ที่พูดภาษาอังกฤษเป็นหมอ
และลำโพงไทยมีผู้ป่วยระบบประกอบด้วยสามส่วนหลัก
, การรู้จำเสียงพูด , แปลภาษา ,
และการสังเคราะห์เสียงพูด เป็น recognizer เสียงพูดภาษาไทยคือ
สร้างโดยใช้เมล็ดและอะคูสติกแบบ multi lingual
ฝึกอบรมโดยจองโรงแรม คำพูดคำจาที่ถ่าย
จากคลังข้อมูลเสียง nectec-atr ทิ้งข้อมูลเสียง

พจนานุกรมที่ใช้สำหรับผู้ให้บริการที่มีอยู่มัน
คำในการวินิจฉัยทางการแพทย์โดเมนการ recognizer
, ซึ่งได้รับการประเมินด้วยคำพูดคำจาจาก
เมนเดียวกันบรรลุ 85% ความถูกต้องของคำ การแปลภาษา
ข้อความในภาษาต้นฉบับคือแจง

และแปลงเป็นภาษากลางผ่านเครื่องแปลภาษาโดยใช้การแลกเปลี่ยนรูปแบบ ( ถ้ามี ) และประโยคภาษา
เป้าหมายถูกสร้างขึ้นจากแจงผล ถ้า
เป็นที่กำหนดเองเพื่อรับมือกับภาษาไทย .สามลักษณะ thaispecific
addressed ในถ้า ; ใช้ของเงื่อนไขพิเศษ
บ่งบอกถึงเพศของบุคคล ยืนยัน
การแสดงออกที่มีความหมายอื่นมากกว่าเพียงแค่ ' ' ใช่ ' '
และแยกคำ จากกริยาหลักเพื่อแสดง
ความเป็นไปได้และ modalities อื่น ๆ สร้างภาษาไทย ประโยค ความหมาย / ประโยคไวยากรณ์ด้วยตนเองเขียน

ค่ะ ทำงานในไทยซินการพูด ,
) มหกรรมโดเมนระบบครอบคลุมแต่คำ
ถูกสร้างขึ้น มันมีประโยคที่ 235 จาก
จองโรงแรมเป็นส่วนหนึ่งของ nectec-atr คลังข้อมูล ( สีดำ และ lenzo
, 2000 ) ปีต่อมา โดยเฉพาะการสืบสวน

ปรับปรุง ASR ส่วนหนึ่งของระบบได้ ( suebvisai
et al . , 2005 ) การเพิ่มประสิทธิภาพขั้นสูงโมดูลเสียง
การฝึกอบรมด้วยชุดข้อต่อ ซึ่งประกอบด้วย ไทย globalphone
คลังข้อมูลและไทยบาบิโลนทางการแพทย์โดเมนคลังข้อมูล
มากกว่าพจนานุกรมการออกเสียงเดียว , พจนานุกรม multivariant
ถูกสร้างขึ้นโดยใช้กฎง่ายๆเช่น
ละเว้นความแตกต่างระหว่าง / ผม / และ / r / ผสมผสานคุณสมบัติ
โทนเป็น ASR ให้โครงการชัดเจน
ที่สุดโมดูลได้ 18.2 % คำ ASR อัตราความผิดพลาด .
การแปล กรุณารอสักครู่..
 
ภาษาอื่น ๆ
การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.

Copyright ©2025 I Love Translation. All reserved.

E-mail: