recognition research emphasized only isolated-word recognition.
In 2000, the National Electronics and Computer
Technology Center (NECTEC) in Thailand initiated a project
to develop the first Thai large vocabulary continuous
speech recognition (LVCSR) corpus (Kasuriya et al.,
2003b). This corpus was not only used for Thai continuous
speech recognition research at NECTEC (Kanokphara,
2003a; Tarsaku and Kanokphara, 2002), but also for many
other research at different sites. In the field of speech synthesis,
systems reached a commercial level of sophistication
by the end of 1990s. Most of the systems currently available
on the market are based on concatenation of subword
units taken from an inventory of subword units. It has also
been reported that the naturalness of synthesized voices
can be improved by using variable-length units selected
from a large corpus of speech utterances (Sagisaka et al.,
1992). NECTEC has also succeeded in improving sound
quality for their TTS system using the same technique
(Hansakunbuntheung et al., 2005a).
At present, research on Thai speech recognition has
moved on to various applications of continuous speech
recognition (Pisarn et al., 2005; Suebvisai et al., 2005;
Thienlikit et al., 2004). Research areas for speech synthesis
include improving intelligibility of text processors and
enhancing naturalness of synthetic speech by improving
prosody prediction. In addition to the basic research
already described, advanced applications of speech, such
as a spoken dialogue system (Suchato et al., 2005;
Wutiwiwatchai and Furui, 2003b) and a speech-to-speech
translation system (Schultz et al., 2004) have also been
attempted. Since basic tools and resources for recognizing
Thai are still limited, developing these applications remains
a formidable task.
Notable reviews and surveys of progress in Thai speech
research published in the past include Luksaneeyanawin
(1993), Jitapunkul et al. (1998), and Thongprasert et al.
(2002). All these papers mainly presented an overview of
the work carried out by their own organizations. In this
paper, we attempt to review all published literature on
speech research in Thai, not only that conducted by particular
organizations. Section 2 introduces both the writing
and sound systems of the Thai language. Section 3
describes research works on fundamental analyses and
tools. Sections 4 and 5 review investigations of Thai speech
synthesis and recognition, respectively. Section 6 presents
research on high-level speech applications. Suggestions
for, and discussion on, potential research directions are
given at the end of the paper.
การวิจัยเน้นการรู้เฉพาะคำแยกต่างหากใน 2000 อิเล็กทรอนิกส์แห่งชาติและคอมพิวเตอร์เทคโนโลยีศูนย์ (NECTEC) ในประเทศไทยเริ่มต้นโครงการการพัฒนาแรกใหญ่คำศัพท์อย่างต่อเนื่องคอร์พัสคริ (LVCSR) การรู้จำเสียง (Kasuriya et al.,2003b) . คอร์พัสครินี้ใช้ในไทยอย่างต่อเนื่องงานวิจัยการรู้จำเสียงที่ NECTEC (Kanokphara2003a Tarsaku และ Kanokphara, 2002), แต่ยัง สำหรับหลายงานวิจัยอื่น ๆ ที่ไซต์อื่น ในการสังเคราะห์เสียงพูดจนถึงระดับเชิงพาณิชย์ของความซับซ้อนของระบบโดยจุดสิ้นสุดของทศวรรษที่ 1990 ที่สุดของระบบมีอยู่ในปัจจุบันในตลาดจะขึ้นอยู่กับการเรียงต่อกันของ subwordหน่วยที่นำมาจากสินค้าคงคลังของหน่วย subword นอกจากนี้ยังมีรายงานว่า naturalness ของสังเคราะห์เสียงสามารถปรับปรุงได้ โดยการใช้หน่วยความยาวตัวแปรที่เลือกจากคอร์พัสคริใหญ่ของเสียง utterances (Sagisaka et al.,1992) . NECTEC ยังได้ประสบความสำเร็จในการปรับปรุงเสียงคุณภาพของระบบ TTS ใช้เทคนิคเดียวกัน(Hansakunbuntheung et al., 2005a)ปัจจุบัน วิจัยไทยรู้ได้ย้ายบนโปรแกรมประยุกต์ต่าง ๆ ของคำพูดที่ต่อเนื่องการรับรู้ (พิศาล et al., 2005 Suebvisai et al., 2005Thienlikit et al., 2004) งานวิจัยการสังเคราะห์เสียงรวมปรับปรุง intelligibility ของตัวประมวลผลข้อความ และเพิ่ม naturalness เสียงสังเคราะห์ โดยการปรับปรุงการคาดเดา prosody นอกจากการวิจัยพื้นฐานแล้วอธิบาย ขั้นสูงใช้คำพูด เช่นเป็นระบบสนทนา (Suchato et al., 2005Wutiwiwatchai และ Furui, 2003b) และการพูดคำพูดนอกจากนี้ยังมีระบบแปล (Schultz et al., 2004)ความพยายาม ตั้งแต่เครื่องมือพื้นฐานและทรัพยากรสำหรับการจดจำไทยจะยังคงจำกัด พัฒนาโปรแกรมประยุกต์เหล่านี้ยังคงงานอันตรายถึงชีวิตเห็นบรรยากาศและสำรวจความคืบหน้าในการพูดไทยLuksaneeyanawin รวมงานวิจัยที่เผยแพร่ในอดีต(1993), Jitapunkul และ al. (1998), และทองประเสริฐ et al(2002) เอกสารเหล่านี้ส่วนใหญ่นำเสนอภาพรวมของงานดำเนินการ โดยองค์กรของตนเอง ในที่นี้กระดาษ เราพยายามตรวจทานเอกสารประกอบการเผยแพร่ทั้งในวิจัยการพูดภาษาไทย ไม่เฉพาะที่ดำเนินการ โดยเฉพาะองค์กร ส่วน 2 แนะนำทั้งการเขียนและระบบเสียงของภาษาไทย หมวดที่ 3อธิบายงานวิจัยบนพื้นฐานวิเคราะห์ และเครื่องมือการ 4 ส่วนและ 5 ทบทวนของเสียงไทยการสังเคราะห์และการรับรู้ ตามลำดับ แสดง 6 ส่วนงานวิจัยในโปรแกรมประยุกต์เสียงระดับสูง คำแนะนำสนทนา ทิศทางการวิจัยอาจมีให้ในตอนท้ายของกระดาษ
การแปล กรุณารอสักครู่..

การวิจัยการรับรู้เน้นการรับรู้คำพูดเพียงลำพัง.
ในปี 2000
อิเล็กทรอนิคส์และคอมพิวเตอร์แห่งชาติศูนย์เทคโนโลยี(เนคเทค)
ในประเทศไทยได้ริเริ่มโครงการที่จะพัฒนาคำศัพท์ที่มีขนาดใหญ่เป็นครั้งแรกของไทยอย่างต่อเนื่องรู้จำเสียงพูด
(กลุ่มที่สอง) คลัง (Kasuriya et al.,
2003b) คลังนี้ไม่ได้ใช้สำหรับการต่อเนื่องภาษาไทยการวิจัยการรู้จำเสียงที่เนคเทค (Kanokphara, 2003a; Tarsaku และ Kanokphara, 2002) แต่ยังสำหรับหลาย ๆงานวิจัยอื่น ๆ ที่เว็บไซต์ที่แตกต่างกัน ในด้านการสังเคราะห์เสียงพูดที่ระบบถึงระดับของความซับซ้อนในเชิงพาณิชย์ภายในสิ้นปี1990 ส่วนใหญ่ของระบบปัจจุบันที่มีอยู่ในตลาดจะขึ้นอยู่กับกำหนดการ subword หน่วยที่นำมาจากสินค้าคงคลังของหน่วย subword นอกจากนี้ยังได้รับรายงานว่าเป็นธรรมชาติของเสียงสังเคราะห์สามารถปรับปรุงโดยใช้หน่วยความยาวตัวแปรที่เลือกจากคลังใหญ่ของคำพูดคำพูด(Sagisaka et al., 1992) เนคเทคยังได้ประสบความสำเร็จในการปรับปรุงเสียงที่มีคุณภาพสำหรับระบบของพวกเขา TTS ใช้เทคนิคเดียวกัน (Hansakunbuntheung et al., 2005A). ในปัจจุบันการวิจัยเกี่ยวกับการรับรู้เสียงพูดภาษาไทยได้ย้ายไปใช้งานต่างๆในการพูดอย่างต่อเนื่องได้รับการยอมรับ(พิศาล et al., 2005 ; Suebvisai et al, 2005;.. Thienlikit, et al, 2004) พื้นที่วิจัยเพื่อการสังเคราะห์เสียงพูดรวมถึงการปรับปรุงความเข้าใจของตัวประมวลผลข้อความและการเสริมสร้างความเป็นธรรมชาติของการสังเคราะห์เสียงพูดโดยการปรับปรุงการทำนายฉันทลักษณ์ นอกจากนี้ยังมีการวิจัยขั้นพื้นฐานที่อธิบายไว้แล้วใช้งานขั้นสูงในการพูดดังกล่าวเป็นระบบการสนทนาพูด(สุชาโต et al, 2005;. Wutiwiwatchai และ Furui, 2003b) และคำพูดเป็นคำพูด. ระบบการแปล (ชูลท์ซ, et al, 2004 ) ยังได้รับการพยายาม ตั้งแต่เครื่องมือพื้นฐานและทรัพยากรในการตระหนักถึงไทย จำกัด ยังคงพัฒนาโปรแกรมเหล่านี้ยังคงเป็นงานที่น่ากลัว. ความคิดเห็นที่โดดเด่นและการสำรวจความคืบหน้าในการพูดภาษาไทยวิจัยที่ตีพิมพ์ในอดีตที่ผ่านมารวมถึง Luksaneeyanawin (1993), Jitapunkul et al, (1998) และทองประเสริฐ et al. (2002) เอกสารทั้งหมดเหล่านี้ส่วนใหญ่นำเสนอภาพรวมของการทำงานที่ดำเนินการโดยองค์กรของตนเอง ในการนี้กระดาษที่เราพยายามที่จะทบทวนวรรณกรรมทั้งหมดที่เผยแพร่ในการวิจัยการพูดภาษาไทยไม่เพียงแต่ที่ดำเนินการโดยเฉพาะอย่างยิ่งองค์กร ส่วนที่ 2 นำเสนอทั้งการเขียนและระบบเสียงภาษาไทย ส่วนที่ 3 อธิบายถึงผลงานวิจัยเกี่ยวกับการวิเคราะห์พื้นฐานและเครื่องมือ ส่วนที่ 4 และ 5 การตรวจสอบความคิดเห็นของเสียงพูดภาษาไทยการสังเคราะห์และการรับรู้ตามลำดับ มาตรา 6 นำเสนองานวิจัยในระดับสูงใช้งานเสียงพูด ข้อเสนอแนะสำหรับและการอภิปรายเกี่ยวกับทิศทางการวิจัยที่มีศักยภาพจะได้รับในตอนท้ายของกระดาษ
การแปล กรุณารอสักครู่..

การวิจัยเน้นเพียงการแยกการรับรู้คำ .
ในปี 2000 , ศูนย์เทคโนโลยีอิเล็กทรอนิกส์และคอมพิวเตอร์แห่งชาติ ( เนคเทค )
เพื่อพัฒนาประเทศไทยได้เริ่มโครงการแรก ไทยขนาดใหญ่คำศัพท์อย่างต่อเนื่อง
การรู้จำเสียงพูด ( lvcsr ) คลังข้อมูล ( kasuriya et al . ,
2003b ) คลังข้อมูลนี้ไม่เพียงแต่ใช้สำหรับการรู้จำเสียงพูดต่อเนื่องภาษาไทย
( kanokphara วิจัยเนคเทค , 2003a ;และ tarsaku kanokphara , 2002 ) , แต่ยังสำหรับหลาย
งานวิจัยอื่น ๆที่เว็บไซต์ที่แตกต่างกัน ในด้านการสังเคราะห์เสียง
ระบบถึงระดับเชิงพาณิชย์ของความซับซ้อน
โดยจุดสิ้นสุดของยุค ที่สุดของระบบปัจจุบันที่มีอยู่
ในตลาดจะขึ้นอยู่กับหน่วยเรียงต่อกัน subword
ถ่ายจากสินค้าคงคลังของหน่วย subword . มันยัง
มีรายงานว่า ธรรมชาติของสังเคราะห์เสียง
สามารถปรับปรุงได้โดยการใช้ตัวแปรความยาวของหน่วยที่เลือกจากคลังข้อมูลขนาดใหญ่
คำพูดคำจา (
sagisaka et al . , 1992 ) เนคเทคยังได้ประสบความสำเร็จในการปรับปรุงคุณภาพเสียงของระบบ TTS
เทคนิคเดียวกัน ( hansakunbuntheung et al . , 2005a ) .
ปัจจุบันงานวิจัยเกี่ยวกับการรู้จำเสียงภาษาไทยได้
ย้ายไปยังโปรแกรมประยุกต์ต่าง ๆ ของการรู้จำเสียงพูด
ต่อเนื่อง ( พิศาล et al . , 2005 ; suebvisai et al . , 2005 ;
thienlikit et al . , 2004 ) พื้นที่สำหรับการวิจัย
การสังเคราะห์รวมถึงการปรับปรุงการเข้าใจในการประมวลผลข้อความและเพิ่มสัมผัสของเสียงพูดสังเคราะห์
ฉันทลักษณ์โดยการปรับปรุงพยากรณ์ นอกจากผลงานวิจัยพื้นฐาน
ได้อธิบายการใช้งานขั้นสูงของการพูด เช่น
เป็นบทสนทนาที่ใช้ระบบ ( suchato et al . , 2005 ;
wutiwiwatchai ฟูรู 2003b และ , ) และเสียงระบบการแปลคำพูด
( Schultz et al . , 2004 ) นอกจากนี้ยังมี
พยายาม ตั้งแต่พื้นฐานเครื่องมือและทรัพยากรที่จำ
ไทยยังคง จำกัด พัฒนาโปรแกรมเหล่านี้ยังคงอยู่
รีวิวงานที่น่าเกรงขาม เด่นและการสำรวจความคืบหน้าในเสียงภาษาไทย
งานวิจัยที่ตีพิมพ์ในอดีตรวมถึงนาวิน
( 1993 ) , จิต et al . ( 1998 ) , และทองประเสริฐ et al .
( 2002 ) เอกสารส่วนใหญ่ที่นำเสนอภาพรวมของงาน
ดำเนินการโดยองค์กรของตนเอง ในกระดาษนี้
, เราพยายามที่จะทบทวนวรรณกรรมวิจัยตีพิมพ์
พูดภาษาไทย ไม่เพียง แต่ที่ดำเนินการโดยองค์กรโดยเฉพาะ
ส่วนที่ 2 แนะนำทั้งการเขียน
และเสียงระบบภาษาไทย หมวด 3
อธิบายถึงผลงานวิจัยเกี่ยวกับการวิเคราะห์พื้นฐานและ
เครื่องมือ ส่วนที่ 4 และ 5 ทบทวนการตรวจสอบเสียงภาษาไทย
การสังเคราะห์และการรับรู้ ตามลำดับ มาตรา ๖ นำเสนองานวิจัยในงาน
พูดพื้นฐาน
สำหรับข้อเสนอแนะและวิจารณ์ ทิศทางการวิจัยที่มีศักยภาพ
ให้ที่ส่วนท้ายของกระดาษ
การแปล กรุณารอสักครู่..
