Detailed information on the Thai writing system can be found in several books
(Haas, 1980; Higbie and Thinsan,2002). In this subsection, we review some important characteristics of written Thai in order to lay the foundation for explanations of research presented in the rest of this paper.
Thai is a tonal language, like Chinese, and is represented in text form with the Thai alphabet. This native alphabet comprises 44 consonants, 15 basic vowels, and 4
additional tone markers. Text is written horizontally, from left to right, with no intervening spaces, to form syllables, words, and sentences. Vowels are written above, below, before, or after the consonant they modify, however the
consonant is always pronounced first when the syllable is spoken. The vowel characters (and a limited number of consonants)
can be combined in various ways to produce numerous compound vowels such as diphthongs.
The grammar of the Thai language is considerably simpler than the grammar of most Western languages, and for many foreigners learning Thai, this compensates
for the additional difficulty of learning tones. It is a ‘‘Subject + Verb + Object’’ language with no definite or indefi-nite article, no verb conjugation, no noundeclension, and no object pronouns. Most significantly, words are not
modified or conjugated for tense, number, gender, or subject-verb agreement. Articles such as English ‘‘a’’,‘‘an’’, or ‘‘the’’ are not used. Tenses, levels of politeness,
and verb-to-noun conversion are accomplished by the simple addition of various modifying words (called ‘‘particles’’) to the basic subject-verb-object format. One of the major problems for Thai language processing is a lack of word boundaries and explicit sentence markers. White space can be used as sentence, phrase, and word boundaries without strict rules. An analogous example in English is the word ‘‘GODISNOWHERE’’, which can be perceived as ‘‘GOD IS NO WHERE’’, ‘‘GOD IS NOWHERE’’, or ‘‘GOD IS NOW HERE’’ depending on the context.
ข้อมูลรายละเอียดเกี่ยวกับระบบการเขียนภาษาไทยที่สามารถพบได้ใน
หนังสือหลายเล่ม ( Haas , 1980 ; higbie และ thinsan , 2002 ) ในส่วนนี้เราจะทบทวนบางคุณลักษณะสำคัญของภาษาไทย เพื่อวางรากฐานสำหรับคำอธิบายของงานวิจัยที่นำเสนอในส่วนที่เหลือของบทความนี้
ไทยเป็นภาษาวรรณยุกต์ เช่น จีน และ จะแสดงในรูปแบบข้อความที่มีตัวอักษรภาษาไทยตัวอักษรพื้นเมืองนี้ประกอบด้วยพยัญชนะและสระพื้นฐาน 15 , 4
เพิ่มเติมรูปวรรณยุกต์ ข้อความที่เขียนในแนวนอนจากซ้ายไปขวา ไม่แทรกแซง เป็น จาก พยางค์ คำ และประโยค สระที่เขียนไว้ด้านบนด้านล่างก่อน หรือหลังจากที่พวกเขาปรับเปลี่ยนพยัญชนะและพยัญชนะเสมอ
เมื่อพยางค์แรกออกเสียงพูดการออกเสียงตัวอักษรและตัวเลข ( พยัญชนะ )
สามารถถูกรวม ด้วยวิธีการต่าง ๆเพื่อผลิตสารมากมาย เช่น สระควบกล้ำ .
ไวยากรณ์ของภาษาไทยมันง่ายกว่ามาก มากกว่าไวยากรณ์ของภาษาตะวันตกมากที่สุดและหลายชาวต่างชาตินี้ชดเชย
สำหรับความยากเพิ่มเติมการเรียนรู้เสียงมันคือ ' 'subject กริยาวัตถุ ' ' ภาษาไม่มีแน่นอน หรือ indefi ไนท์บทความ ไม่มีกริยาการ ไม่ noundeclension และไม่ใช้วัตถุ มากที่สุด คำพูดไม่ได้
แก้ไขหรือ conjugated กาล จำนวน เพศ หรือ ประธาน กริยา ข้อตกลง บทความดังกล่าวเป็นภาษาอังกฤษ ' ' ' ' ''an ' ' หรือ ' ' ' ' ไม่ ใช้ ระดับของความสุภาพ
กาลกริยาและคำนาม คือ การแปลง ได้โดยง่าย ๆ นอกจากการปรับเปลี่ยนคำ ( เรียกว่า ' 'particles ' ' ) กริยาเรื่องพื้นฐานวัตถุรูปแบบ หนึ่งในปัญหาหลักสำหรับการประมวลผลภาษาไทยมันไม่มีขอบเขตคำและประโยคที่มีเครื่องหมาย พื้นที่สีขาวสามารถใช้เป็นประโยค , วลี , และขอบเขต ไม่มีกฎที่เข้มงวดเป็นแบบตัวอย่างในภาษาอังกฤษคำว่า ' 'godisnowhere ' ' ซึ่งสามารถรับรู้เป็น ' 'god ไม่มีที่ไหน ' ' , ' 'god ไหน ' ' หรือ ' 'god อยู่ที่นี่ ' ' ขึ้นอยู่กับบริบท
การแปล กรุณารอสักครู่..
