The models mentioned above have mostly been proposed
as front-end processes for other higher-level linguistic
tasks such as syntactic analysis. For Thai speech
systems, the process of word segmentation is necessary
before phonological analysis can be performed. Since direct
word segmentation is difficult, it is more suitable to perform
syllabification instead of word segmentation. Syllabi-
fication in Thai has been performed using a dictionary
(Poowarawan, 1986), syllabification rules (Chanyapornpong,
1983; Khruahong et al., 2003; Mamoru and Satoshi,
2001; Sawamipakdee, 1990; Thairatananond, 1981), and a
combination of rules and a statistical model (Aroonmanakun,
2002). It is commonly acknowledged that these
approaches have different advantages/disadvantages, i.e.
the rule-based approach requires low computational power
and memory but has difficulty resolving ambiguous cases,
whereas the statistical approach needs a large annotated
corpus for training.
รูปแบบดังกล่าวข้างต้นส่วนใหญ่ได้รับการเสนอเป็นกระบวนการ front-end อื่น ๆ ภาษาระดับสูงงานเช่นการวิเคราะห์ประโยค สำหรับเสียงพูดภาษาไทยระบบขั้นตอนการตัดคำเป็นสิ่งที่จำเป็นก่อนที่จะวิเคราะห์เสียงสามารถดำเนินการได้ ตั้งแต่โดยตรงตัดคำเป็นเรื่องยากที่มันจะเหมาะสมที่จะดำเนินการsyllabification แทนการตัดคำ Syllabi- การตรวจในไทยได้รับการดำเนินการโดยใช้พจนานุกรม(Poowarawan 1986) กฎ syllabification (Chanyapornpong, 1983; Khruahong et al, 2003;. มาโมรุและซาโตชิ, 2001; Sawamipakdee, 1990; Thairatananond, 1981) และการรวมกันของกฎระเบียบและแบบจำลองทางสถิติ (Aroonmanakun, 2002) เป็นที่ยอมรับกันทั่วไปว่าสิ่งเหล่านี้วิธีการที่แตกต่างกันมีข้อดี / ข้อเสียคือวิธีการตามกฎต้องใช้พลังงานในการคำนวณที่ต่ำและหน่วยความจำแต่มีความยากลำบากการแก้ปัญหากรณีที่คลุมเครือในขณะที่วิธีการทางสถิติความต้องการข้อเขียนขนาดใหญ่คลังสำหรับการฝึกอบรม
การแปล กรุณารอสักครู่..

รุ่นที่กล่าวถึงข้างต้นส่วนใหญ่ถูกเสนอ
เป็น front-end สำหรับงานระดับสูงกว่ากระบวนการอื่น เช่น การวิเคราะห์ลักษณะทางภาษาศาสตร์
. ระบบการพูด
ไทย , กระบวนการของการตัดคำที่จำเป็น
ก่อนการวิเคราะห์ระบบเสียงสามารถดําเนินการ เนื่องจากการตัดคำโดยตรง
เป็นเรื่องยาก มันเหมาะจะแสดง
syllabification แทนการตัดคำ . พบ -
fication ในไทยมีการใช้พจนานุกรม
( poowarawan , 1986 ) , กฎ syllabification ( chanyapornpong
, 1983 ; khruahong et al . , 2003 ; มาโมรุ และ ซาโตชิ
2001 sawamipakdee 1990 ; thairatananond , 1981 ) และการรวมกันของกฎ
และโมเดลทางสถิติ ( เอี่ยมสุข
, 2002 ) มันเป็นที่ยอมรับว่าแนวทางนี้มีข้อเสียข้อดีต่างกัน /
)การใช้พลังงานต่ำวิธีการกฎ
การคำนวณและหน่วยความจำ แต่มีปัญหาการคลี่คลายคดีคลุมเครือ ขณะที่วิธีการทางสถิติความต้องการ
คลังข้อมูลขนาดใหญ่บนอินเทอร์เน็ตสำหรับการฝึกอบรม
การแปล กรุณารอสักครู่..
