Detailed information on the Thai writing system can be
found in several books (Haas, 1980; Higbie and Thinsan,
2002). In this subsection, we review some important characteristics
of written Thai in order to lay the foundation
for explanations of research presented in the rest of this
paper. Thai is a tonal language, like Chinese, and is represented
in text form with the Thai alphabet. This native
alphabet comprises 44 consonants, 15 basic vowels, and 4
additional tone markers. Text is written horizontally, from
left to right, with no intervening spaces, to form syllables,
words, and sentences. Vowels are written above, below,
before, or after the consonant they modify, however the
consonant is always pronounced first when the syllable is
spoken. The vowel characters (and a limited number of
consonants) can be combined in various ways to produce
numerous compound vowels such as diphthongs.
The grammar of the Thai language is considerably
simpler than the grammar of most Western languages,
and for many foreigners learning Thai, this compensates
for the additional difficulty of learning tones. It is a ‘‘Subject
+ Verb + Object’’ language with no definite or indefi-
nite article, no verb conjugation, no noun declension, and
no object pronouns. Most significantly, words are not
modified or conjugated for tense, number, gender, or
subject-verb agreement. Articles such as English ‘‘a’’,
‘‘an’’, or ‘‘the’’ are not used. Tenses, levels of politeness,
and verb-to-noun conversion are accomplished by the
simple addition of various modifying words (called ‘‘particles’’)
to the basic subject-verb-object format. One of the
major problems for Thai language processing is a lack of
word boundaries and explicit sentence markers. White
space can be used as sentence, phrase, and word boundaries
without strict rules. An analogous example in English
is the word ‘‘GODISNOWHERE’’, which can be perceived
as ‘‘GOD IS NO WHERE’’, ‘‘GOD IS NOWHERE’’, or
‘‘GOD IS NOW HERE’’ depending on the context.
ข้อมูลรายละเอียดเกี่ยวกับระบบการเขียนภาษาไทยสามารถ
พบในหนังสือหลายเล่ม ( Haas , 1980 ; higbie และ thinsan
, 2002 ) ในส่วนนี้เราตรวจสอบบางส่วนของลักษณะสำคัญ
ภาษาไทยเพื่อวางรากฐาน
อธิบายวิจัยที่นำเสนอในส่วนที่เหลือของบทความนี้
ภาษาไทยเป็นภาษาวรรณยุกต์ เช่น จีน และเป็นตัวแทน
ในรูปแบบข้อความที่มีตัวอักษรภาษาไทยตัวอักษรพื้นเมือง
นี้ประกอบด้วยพยัญชนะและสระพื้นฐาน 15 , 4
เพิ่มเติมรูปวรรณยุกต์ ข้อความที่เขียนในแนวนอนจากซ้ายไปขวา
โดยไม่แทรกแซง เป็น จาก พยางค์
คำ และประโยค สระที่เขียนไว้ด้านบนด้านล่าง
ก่อนหรือหลังพยัญชนะพวกเขาปรับเปลี่ยน แต่ออกเสียงพยัญชนะเสมอ
แรกเมื่อพยางค์ได้การออกเสียงตัวอักษร ( และจำกัดจำนวน
พยัญชนะ ) สามารถถูกรวม ด้วยวิธีการต่าง ๆเพื่อผลิตสารมากมาย เช่น สระควบกล้ำ
.
ไวยากรณ์ของภาษาไทยมาก
ง่ายกว่าไวยากรณ์ของภาษาตะวันตกที่สุด
และหลายชาวต่างชาตินี้ชดเชย
สำหรับความยากเพิ่มเติมการเรียนรู้ โทน มันคือ ' 'subject
กริยาวัตถุ ' ' ภาษาไม่มีแน่นอน หรือ indefi -
ไนท์บทความ ไม่มีกริยาการไม่มีวิภัตตินามและสรรพนาม
ไม่มีวัตถุ มากที่สุด คำพูดไม่ได้
แก้ไขหรือ conjugated กาล จำนวน เพศ หรือ
ประธาน กริยา ข้อตกลง บทความดังกล่าวเป็นภาษาอังกฤษ ' ' ' '
''an ' ' หรือ ' ' ' ' ไม่ ใช้ ระดับของความสุภาพ
กาลกริยาและคำนาม คือ การแปลง ได้โดยง่าย ๆ นอกจากการปรับเปลี่ยน
คำ ( เรียกว่า ' 'particles ' ' )
ที่คำกริยาเรื่องพื้นฐานวัตถุรูปแบบ หนึ่งในปัญหาหลักสำหรับการประมวลผลภาษาไทย
คือไม่มีขอบเขตคำและประโยคที่มีเครื่องหมาย พื้นที่สีขาว
สามารถใช้เป็นประโยค , วลี , และขอบเขตของคํา
ไม่มีกฎที่เข้มงวด ตัวอย่างที่คล้ายกันในภาษาอังกฤษ
คือคำว่า ' 'godisnowhere ' ' ซึ่งสามารถรับรู้
' 'god ไม่มีที่ไหน ' ' , ' 'god ไหน ' ' , หรือ
''god อยู่ที่นี่ ' ' ขึ้นอยู่กับบริบท
การแปล กรุณารอสักครู่..