Wutiwiwatchai and Furui (2003b) initiated the first
complete Thai spoken dialogue system in the domain of
hotel reservation. Their subsequent works investigated a
novel spoken language understanding (SLU) component
(Wutiwiwatchai and Furui, 2006; Wutiwiwatchai and
Furui, 2003a; Wutiwiwatchai and Furui, 2004a), which
was suitable for languages with weak grammars such as
Thai. The SLU model consisted of three parts: concept
extraction based on weighted finite-state automata; goal
identification using a pattern classifier; and, concept-value
extraction based on simple rules. The model was claimed
to be able to handle sentences with highly flexible grammar.
Moreover, the SLU model can be trained by a
partially annotated corpus and hence is expected to be
applicable to other languages and dialogue domains as
well. A more efficient method of concept extraction introduced
in their subsequent work was a hybrid statistical
and structural semantic model, which was implemented
on the basis of weighted finite-state automata (Wutiwiwatchai
and Furui, 2004b).
In 2005, Suchato et al. (2005) set up another Thai spoken
dialogue system in the domain of call routing, which
helped connect a desired person to a customer. They evaluated
two dialogue flows, a one-step request where the
customer input both the contact name and his/her
department, and a two-step request where the name of
the department needed to be input prior to the name of
the person within that department. Although the system
was simple, it showed a higher potential for the use of this
speech recognition engine over a telephone network.
6.2. Speech translation
An important pioneering work proposed by Schultz
et al. (2004) was an English–Thai speech-to-speech translation
system in the medical diagnosis domain. The paper
described a two-way speech-to-speech translation system
between Thai and English for dialogues in the limited
medical domain, where the English speaker was a doctor
and the Thai speaker was a patient. The system consisted
of three major parts, speech recognition, language translation,
and speech synthesis. A Thai speech recognizer was
built using a seed multi-lingual acoustic model and
retrained by the hotel reservation speech utterances taken
from the NECTEC-ATR speech corpus, disregarding tone
information. The lexicon used for ASR contained 734
words in the medical diagnosis domain. The recognizer,
which had been evaluated with speech utterances from
the same domain, achieved 85% word accuracy. For language
translation, text in the source language was parsed
and converted to an interlingua via machine translation
using the Interchange Format (IF), and target-language
Wutiwiwatchai และ Furui (2003b) เริ่มแรกทำระบบสนทนาไทยในโดเมนของจองห้องพัก ตรวจสอบการปฏิบัติงานภายหลังการนวนิยายพูดภาษาเข้าใจ (SLU) ส่วนประกอบ(Wutiwiwatchai และ Furui, 2006 Wutiwiwatchai และFurui, 2003a Wutiwiwatchai และ Furui, 2004a), ซึ่งไม่เหมาะกับ grammars อ่อนแอเช่นไทย รุ่น SLU ประกอบด้วย 3 ส่วน: แนวคิดแยกตามออโตมาตาสถานะจำกัดน้ำหนัก เป้าหมายรหัสที่ใช้ classifier รูปแบบ และ แนวคิดค่าแยกตามกติกาง่าย ๆ แบบจำลองถูกอ้างสามารถจัดการกับประโยค มีไวยากรณ์ที่มีความยืดหยุ่นสูงนอกจากนี้ รุ่น SLU สามารถรับคำสอนโดยการบางส่วนของการใส่คำอธิบายประกอบคอร์พัสคริ และดังนั้น คาดว่าจะใช้กับภาษาอื่น ๆ และโดเมนโต้เป็นดี วิธีการสกัดแนวคิดที่นำมาใช้มีประสิทธิภาพมากขึ้นในการทำงานของพวกเขาต่อมาถูกผสมทางสถิติและโครงสร้างทางตรรก ซึ่งได้ดำเนินการโดยออโตมาตาสถานะจำกัดถ่วงน้ำหนัก (Wutiwiwatchaiก Furui, 2004b)ในปี 2005, Suchato et al. (2005) ตั้งค่าพูดไทยอีกบทสนทนาระบบในโดเมนของการเรียกสาย การช่วยเชื่อมต่อผู้ที่ต้องการ จะมีประเมินสองโต้ไหล คำขอขั้นตอนเดียวเป็นการลูกค้าป้อนข้อมูลชื่อผู้ติดต่อทั้งสอง และเขา/เธอแผนก และสองขั้นตอนการร้องขอชื่อต้องป้อนก่อนชื่อของแผนกบุคคลในแผนกนั้น ๆ แม้ว่าระบบนำ พบว่ามีศักยภาพสูงในการใช้งานนี้โปรแกรมการรู้จำเสียงผ่านเครือข่ายโทรศัพท์6.2 การพูดแปลสำคัญการทำงานเสนอ โดย Schultzal. ร้อยเอ็ด (2004) ถูกแปลเป็นคำพูดคำพูดอังกฤษ – ไทยระบบในโดเมนการวินิจฉัยทางการแพทย์ กระดาษอธิบายระบบสองทางคำพูดพูดแปลระหว่างไทยและอังกฤษสำหรับประเด็นในการจำกัดโดเมนทางการแพทย์ ที่พูดภาษาอังกฤษได้เป็นหมอและลำโพงไทยมีผู้ป่วย ระบบประกอบด้วยสามส่วนสำคัญ รู้ แปลภาษาและการสังเคราะห์เสียงพูด ตัวรู้พูดไทยได้สร้างโดยใช้แบบจำลองระดับบอสเมล็ด และretrained โดย utterances จองโรงแรมพูดมาจากคอร์พัสคริเสียง เนคเทคเอทีอาร์โดยเสียงข้อมูล ปทานุกรมที่ใช้สำหรับ ASR อยู่ 734คำในโดเมนการวินิจฉัยทางการแพทย์ จำแนกซึ่งได้รับการประเมินกับเสียง utterances จากโดเมนเดียวกัน ทำได้ 85% คำความถูกต้อง สำหรับภาษาแปล ข้อความในภาษาต้นฉบับถูกแยกวิเคราะห์และแปลงกับภาษากลางที่ผ่านการแปลภาษาด้วยเครื่องโดยใช้รูปแบบที่แลกเปลี่ยน (ถ้า), และภาษาเป้าหมาย
การแปล กรุณารอสักครู่..

Wutiwiwatchai และ Furui (2003b) เริ่มแรกที่สมบูรณ์แบบไทยพูดบทสนทนาในระบบโดเมนของการจองโรงแรม ผลงานของพวกเขาที่ตามมาสอบสวนความเข้าใจภาษาพูดนวนิยาย (SLU) ส่วนประกอบ (Wutiwiwatchai และ Furui 2006; Wutiwiwatchai และFurui, 2003a; Wutiwiwatchai และ Furui, 2004a) ซึ่งเป็นที่เหมาะสมสำหรับภาษาที่มีไวยากรณ์ที่อ่อนแอเช่นไทย รูปแบบ SLU ประกอบด้วยสามส่วนคือแนวคิดการสกัดขึ้นอยู่กับออโตจำกัด รัฐถ่วงน้ำหนัก; เป้าหมายการระบุการใช้ลักษณนามรูปแบบ; และแนวความคิดที่มีมูลค่าการสกัดบนพื้นฐานของกฎง่ายๆ รูปแบบที่ได้รับการอ้างว่าจะสามารถที่จะจัดการกับประโยคที่มีความยืดหยุ่นสูงไวยากรณ์. นอกจากนี้ยังมีรูปแบบการ SLU สามารถผ่านการฝึกอบรมโดยคลังข้อเขียนบางส่วนและด้วยเหตุนี้คาดว่าจะมีผลบังคับใช้กับภาษาอื่นๆ และการเจรจาโดเมนเป็นอย่างดี วิธีที่มีประสิทธิภาพมากขึ้นของแนวคิดการสกัดนำมาใช้ในการทำงานของพวกเขาที่ตามมาเป็นไฮบริดทางสถิติและโครงสร้างรูปแบบความหมายที่ถูกนำมาใช้บนพื้นฐานของออโตจำกัด รัฐถ่วงน้ำหนัก (Wutiwiwatchai และ Furui, 2004b). ในปี 2005 สุชาโต et al, (2005) การตั้งค่าอื่นพูดไทยระบบการสนทนาในโดเมนของการกำหนดเส้นทางสายซึ่งช่วยเชื่อมต่อเป็นคนที่ต้องการให้กับลูกค้า พวกเขาได้รับการประเมินทั้งสองไหลเจรจาขอขั้นตอนเดียวที่ป้อนข้อมูลลูกค้าทั้งชื่อติดต่อและของเขา/ เธอสรรพสินค้าและการร้องขอที่สองขั้นตอนที่ชื่อของฝ่ายที่จำเป็นในการป้อนข้อมูลก่อนที่จะมีชื่อของคนที่อยู่ในนั้นแผนก แม้ว่าระบบได้ง่ายมันแสดงให้เห็นศักยภาพที่สูงขึ้นสำหรับการใช้งานของนี้การรู้จำเสียงผ่านเครือข่ายโทรศัพท์. 6.2 แปลคำพูดของงานที่เป็นผู้บุกเบิกที่สำคัญที่เสนอโดยชูลท์ซและอัล (2004) เป็นภาษาอังกฤษเป็นภาษาไทยคำพูดเป็นคำพูดแปลระบบในโดเมนการวินิจฉัยทางการแพทย์ กระดาษที่อธิบายไว้สองทางคำพูดเป็นคำพูดระบบการแปลระหว่างภาษาไทยและภาษาอังกฤษเพื่อหารือในที่จำกัดโดเมนทางการแพทย์ที่พูดภาษาอังกฤษเป็นหมอและลำโพงไทยเป็นผู้ป่วย ระบบประกอบด้วยสามส่วนใหญ่รู้จำเสียงพูด, การแปลภาษาและการสังเคราะห์เสียงพูด รู้จำเสียงพูดภาษาไทยได้ถูกสร้างขึ้นโดยใช้เมล็ดรูปแบบอะคูสติกได้หลายภาษาและการฝึกอบรมจากคำพูดคำพูดการจองโรงแรมที่นำมาจากคำพูดของเนคเทคคอร์ปัสATR-ไม่คำนึงถึงเสียงข้อมูล ศัพท์ที่ใช้สำหรับ ASR มี 734 คำในโดเมนการวินิจฉัยทางการแพทย์ จำแนก, ซึ่งได้รับการประเมินด้วยคำพูดคำพูดจากโดเมนเดียวกันประสบความสำเร็จในความถูกต้องของคำว่า 85% สำหรับภาษาแปลข้อความในภาษาต้นฉบับที่ถูกแยกและแปลงนานาชาติผ่านเครื่องแปลภาษาโดยใช้รูปแบบการแลกเปลี่ยน(IF) และเป้าหมายภาษา
การแปล กรุณารอสักครู่..

และ wutiwiwatchai ฟูรู ( 2003b ) ริเริ่มครั้งแรก
สมบูรณ์ไทย บทสนทนาที่ใช้ในระบบโดเมนของ
จองโรงแรม ของพวกเขาที่ตามมาทำงานตรวจสอบ
นวนิยายพูดความเข้าใจภาษา ( slu )
( และส่วนประกอบ wutiwiwatchai ฟูรู , 2006 ; wutiwiwatchai
ฟูรูอิ และ 2003a ; wutiwiwatchai ฟูรู , และ , ,
2004a ) ซึ่งเหมาะสมกับไวยากรณ์ภาษาอ่อนแอเช่น
ไทยการ slu ประกอบด้วยสามส่วน : การสกัดแนวคิด
ขึ้นอยู่กับน้ำหนักจำกัดรัฐ จำกัด การกำหนดเป้าหมายการใช้ลักษณนาม
รูปแบบ และ การแยกค่า
แนวความคิดตามกฎง่ายๆ แบบที่ถูกอ้างว่า
เพื่อให้สามารถจัดการกับประโยคที่มีไวยากรณ์มีความยืดหยุ่นสูง .
นอกจากนี้ slu แบบจำลองสามารถฝึกโดย
บางส่วนแสดงคลังข้อมูลจึงคาดว่าจะ
ใช้กับภาษาอื่น ๆและบทสนทนาโดเมนเป็น
ดี เป็นวิธีที่มีประสิทธิภาพมากขึ้นของการสกัดแนวคิดแนะนำ
ในงานที่ตามมาของพวกเขาคือ
สถิติไฮบริดและรูปแบบโครงสร้างทางตรรก ซึ่งถูกพัฒนาบนพื้นฐานของน้ำหนัก
จำกัดรัฐจำกัด ( wutiwiwatchai และ ฟูรูอิ
,
2004b ) ในปี 2005 suchato et al . ( 2005 ) การตั้งค่าอื่นภาษาไทยพูด
ระบบสนทนาในโดเมนของการจัดเส้นทางการเรียก ซึ่ง
ช่วยเชื่อมต่อที่ต้องการคนลูกค้า พวกเขาประเมิน
สองบทสนทนาไหลขั้นตอนเดียวขอที่
ลูกค้าใส่ทั้งชื่อของเขา / เธอและติดต่อแผนก
และขอสองขั้นตอนที่ชื่อ
แผนกต้องใส่ก่อนชื่อ
บุคคลภายในแผนกนั้น แม้ว่าระบบ
ได้ง่ายมันมีค่าศักยภาพในการใช้งานนี้
speech recognition engine ผ่านเครือข่ายโทรศัพท์
6.2 . การแปลสุนทรพจน์
ที่สำคัญงานบุกเบิกที่เสนอโดย Schultz
et al . ( 2004 ) เป็นภาษาอังกฤษ–ไทยพูดกับระบบการแปล
การพูดในการวินิจฉัยทางการแพทย์โดเมน กระดาษ
พูดอธิบายแบบสองทางระบบการแปลคำพูดระหว่างภาษาไทยและภาษาอังกฤษบทสนทนาใน
จำกัดโดเมนแพทย์ที่พูดภาษาอังกฤษเป็นหมอ
และลำโพงไทยมีผู้ป่วย ระบบประกอบด้วยสามส่วนหลัก
, การรู้จำเสียงพูด , แปลภาษา ,
และการสังเคราะห์เสียงพูด เป็น recognizer เสียงพูดภาษาไทยคือ
สร้างโดยใช้เมล็ดและอะคูสติกแบบ multi lingual
ฝึกอบรมโดยจองโรงแรม คำพูดคำจาที่ถ่าย
จากคลังข้อมูลเสียง nectec-atr ทิ้งเสียง
ข้อมูล พจนานุกรมที่ใช้สำหรับผู้ให้บริการที่มีอยู่มัน
คำในการวินิจฉัยทางการแพทย์โดเมน การ recognizer
, ซึ่งได้รับการประเมินด้วยคำพูดคำจาจาก
เมนเดียวกันบรรลุ 85% ความถูกต้องของคำ การแปลภาษา
ข้อความในภาษาต้นฉบับคือแจง
และแปลงเป็นภาษากลางผ่านเครื่องแปลภาษาโดยใช้การแลกเปลี่ยนรูปแบบ ( ถ้ามี ) และภาษาเป้าหมาย
การแปล กรุณารอสักครู่..
