1.1 Rule-Based and Example-Based Ap

1.1 Rule-Based and Example-Based Approaches
The rule-based translation mostly consists of (1) a process of analyzing input sentences of a source
language morphologically, syntactically and/or semantically and (2) a process of generating output
sentences of a target language based on an internal structure or interlingua. Each process is controlled by
the dictionary and the rules. Meanwhile, the basic idea of example-based method is to translate a sentence
by using translation examples of similar sentences [1]. The primary steps of example-based method are 1)
collect examples in a database, 2) given an input, retrieve similar examples from the database, and 3)
adapt the results of the similar examples to the current input and obtain the output.
Utsuro et al. [2] propose an example retrieval method for avoiding full retrieval of examples. The
proposed method generates retrieval queries from similarities, retrieving examples through the tree
structure of a thesaurus and then using binary search along subsumption ordering of retrieval queries.
Cranias et al. [I] introduce a matching method that measures similarity according to both surface structure
and content. Another contribution involves the use of a clustering procedure to make the best matchingexample from the database. This method relies on the segmentation of sentences into coherent segments
and their alignment at the sub-sentential level.
1.2 The hybrid translation method
Many researchers apply both the rule-based and example-based methods as their own hybrid methods.
Shirai et al.[3] propose a new hybrid translation method that combines a rule-based with an example-based
method. An outline of the hybrid algorithm is: 1) find candidate sentences which are similar to the input
sentence, 2) select the template: (a) rank the candidates by similarity to the input sentence (b) cluster the
translations of the candidate sentences (c) select the highest ranked pair of the best cluster, 3) translate
input sentence by analogy to a selected template 4) output the adjusted sentence. For each difference, find
it and translate using the rule-based modules.
They point out that this hybrid system is a method selects the strongest features of rule-based and
example-based, while avoiding their weaknesses. The strengths of the rule-based method are that the
information can be obtained through introspection and analysis, while those of example-based are that
correspondences can be found from raw data. The weakness of the rule-based method is that the accuracy
of entire process is the product of the accuracy of each sub-stage. The weakness of the example-based
method is the difficulty in finding appropriate examples.
They also conclude that a useful example-based system should be able to accept loosely aligned corpora,
not those aligned at low levels. Their prototype. Japanese-English system tested by translating with a
corpus of 5,000 sentences, can use loosely aligned texts. It allows users to take advantage of any aligned
text they have by adding it to the set of sentences searched by the system.
Although these combined methods work successfully to a certain extent, it can not be applied directly to
the English to Thai sentence translation. Compared with Japanese and English, both of them have sentence
markers and each word in a sentence is segmented by a pause or space between the words. Therefore, the
task of sentence alignment can be performed efficiently. The translation process based on the principle of
analogy with a large corpora of parallel texts as database is quite successful and the resulting translations
are reliable. In contrast, one lingering linguistic problem of Thai is word segmentation, due to its run-on
sentences that have no boundary marker. It, therefore, causes the difficulty in sentence alignment. As a
result we have not a large enough volume of aligned sentence corpus as raw data for example-based

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

1.1 ตามกฎ ตามตัวอย่าง และแนวทางแปลตามกฎส่วนใหญ่ประกอบด้วย (1) กระบวนการการวิเคราะห์ประโยคของแหล่งสัญญาณภาษา morphologically ข้อ และ/หรือประโยค และ (2) กระบวนการของการสร้างผลผลิตประโยคของภาษาเป้าหมายตามแบบโครงสร้างภายในหรือภาษากลาง แต่ละกระบวนการจะถูกควบคุมโดยพจนานุกรมและกฎ ในขณะเดียวกัน ความคิดพื้นฐานของวิธีตามตัวอย่างคือการ แปลประโยคโดยใช้ตัวอย่างการแปลของประโยคคล้ายกัน [1] ขั้นตอนหลักของวิธีใช้ตัวอย่าง 1)เก็บตัวอย่างในฐานข้อมูล 2) ให้ได้ ดึงตัวอย่างคล้ายกันจากฐานข้อมูล และ 3)ปรับผลลัพธ์ของตัวอย่างคล้ายกับการป้อนข้อมูลปัจจุบัน และได้รับผลผลิตUtsuro et al. [2] นำเสนอวิธีการเรียกตัวอย่างการเรียกเต็มตัวอย่างหลีกเลี่ยง ที่เสนอวิธีสร้างแบบสอบถามเรียกจากความคล้ายคลึง ดึงตัวอย่างโดยใช้แผนภูมิโครงสร้างของอรรถาภิธานและใช้ค้นหาแบบไบนารีตาม subsumption สั่งเรียกแบบสอบถามAl. et Cranias [I] แนะนำวิธีการตรงที่วัดความคล้ายคลึงกันตามโครงสร้างพื้นผิวทั้งสองและเนื้อหา ส่วนอื่นที่เกี่ยวข้องกับการใช้ของกระบวนการระบบคลัสเตอร์เพื่อให้ matchingexample สุดจากฐานข้อมูล วิธีการนี้อาศัยการแบ่งกลุ่มของประโยคลงในเซ็กเมนต์ coherentและตำแหน่งของพวกเขาในระดับย่อย sentential1.2 วิธีการแปลผสมนักวิจัยจำนวนมากใช้ทั้งสอง ตามกฎ ตามตัวอย่าง และวิธีการที่เป็นวิธีการผสมตัวเองชิโอะ et al. [3] เสนอวิธีแปลไฮบริดใหม่ที่รวมกฎขึ้นอยู่กับการตัวอย่างตามวิธีการ เป็นเค้าร่างของอัลกอริทึมไฮบริด: 1) พบประโยคที่คล้ายกับการป้อนข้อมูลผู้สมัครประโยค 2) เลือกแบบ: (ก) อันดับผู้สมัคร โดยรับสัญญาณคล้ายประโยคขคลัสเตอร์คำแปลของประโยคผู้สมัคร (c) เลือกคู่อันดับสูงสุดของคลัสเตอร์ดีที่สุด 3) แปลผลประโยคเข้า โดยเปรียบเทียบกับเท็มเพลตที่เลือก 4) ปรับปรุงประโยค สำหรับแต่ละความแตกต่าง ค้นหามัน และแปลโดยใช้โมดูตามกฎพวกเขาชี้ให้เห็นว่า ระบบไฮบรินี้เป็นวิธีการเลือกคุณลักษณะที่แข็งแกร่งของตามกฎ และตัวอย่างงาน ขณะที่หลีกเลี่ยงจุดอ่อนของพวกเขา จุดแข็งของวิธีการตามกฎเป็นที่สามารถได้รับข้อมูลผ่านวิปัสสนาและการวิเคราะห์ ในขณะที่ผู้ใช้ตัวอย่างที่ตอบกลับที่สามารถพบได้จากข้อมูลดิบ จุดอ่อนของวิธีการตามกฎคือความถูกต้องของกระบวนการทั้งหมดเป็นผลิตภัณฑ์ของความถูกต้องของแต่ละขั้นตอนย่อย จุดอ่อนของตัวอย่างตามวิธีการความยากลำบากในการหาตัวอย่างที่เหมาะสมได้ยังสรุปว่า ระบบตามตัวอย่างที่มีประโยชน์ควรจะยอมรับซึ่งจัดตำแหน่ง corporaไม่สอดคล้องในระดับต่ำ ต้นแบบของพวกเขา ญี่ปุ่นอังกฤษระบบทดสอบการด้วยการคอร์พัสคริ 5000 ประโยค สามารถใช้ข้อความที่จัดตำแหน่งซึ่ง จะช่วยให้ผู้ใช้ประโยชน์ของการจัดตำแหน่งข้อความได้ ด้วยการเพิ่มชุดของประโยคที่ค้นหา โดยระบบแม้ว่าวิธีการทำงานสำเร็จบางขอบเขตรวมเหล่านี้ มันไม่สามารถใช้โดยตรงไปที่ภาษาอังกฤษการแปลประโยคไทย ทั้งสองอย่างเปรียบเทียบกับภาษาญี่ปุ่นและภาษาอังกฤษ มีประโยคเครื่องหมายและแต่ละคำในประโยคจะถูกแบ่งเป็นช่วงการหยุดชั่วคราวหรือช่องว่างระหว่างคำ ดังนั้น การสามารถดำเนินงานการจัดตำแหน่งของประโยคได้อย่างมีประสิทธิภาพ ตามหลักการของการแปลเทียบกับ corpora ขนาดใหญ่ของข้อความขนานเป็นฐานข้อมูลจะค่อนข้างประสบความสำเร็จ และการแปลผลมีความน่าเชื่อถือ ในทางตรงกันข้าม หนึ่งลิงเกอร์ริงการ์ปัญหาภาษาศาสตร์ของไทยจะแบ่งกลุ่มคำ เนื่องจากเป็นส่วน ๆประโยคที่มีเครื่องหมายไม่มีขอบเขต มัน ดังนั้น ทำให้ยากในการจัดตำแหน่งของประโยค เป็นการเรามีไม่พอจำนวนมากวางประโยคคอร์พัสคริเป็นข้อมูลดิบสำหรับผลลัพธ์ตามตัวอย่าง

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

1.1 ตามกฎและตัวอย่างที่ใช้วิธี
การแปลตามกฎส่วนใหญ่ประกอบด้วย (1) ขั้นตอนของการวิเคราะห์ประโยคป้อนข้อมูลของแหล่งที่มา
ภาษาสัณฐานวิทยา, ไวยากรณ์และ / หรือความหมายและ (2) เป็นกระบวนการในการสร้างผลผลิต
ประโยคของเป้าหมาย ภาษาที่ขึ้นอยู่กับโครงสร้างภายในหรือนานาชาติ แต่ละขั้นตอนจะถูกควบคุมโดย
พจนานุกรมและกฎระเบียบ ในขณะที่ความคิดพื้นฐานของวิธีการตัวอย่างที่ใช้คือการแปลประโยค
โดยใช้ตัวอย่างแปลประโยคที่คล้ายกัน [1] ขั้นตอนวิธีการหลักของตัวอย่างที่ใช้คือ 1)
เก็บตัวอย่างในฐานข้อมูล 2) ได้รับการป้อนข้อมูลดึงตัวอย่างที่คล้ายกันจากฐานข้อมูลและ 3)
ผลของการปรับตัวเข้ากับตัวอย่างที่คล้ายกันที่จะใส่ในปัจจุบันและได้รับการส่งออก.
Utsuro และคณะ [2] เสนอวิธีการดึงตัวอย่างในการหลีกเลี่ยงการดึงเต็มรูปแบบของตัวอย่าง
วิธีที่เสนอสร้างแบบสอบถามการดึงจากความคล้ายคลึงกันเรียกตัวอย่างผ่านต้นไม้
โครงสร้างของพจนานุกรมแล้วใช้การค้นหาแบบไบนารีพร้อม subsumption สั่งซื้อของคำสั่งการเรียก.
Cranias และคณะ [I] แนะนำวิธีการจับคู่ที่คล้ายคลึงกันตามมาตรการทั้งโครงสร้างพื้นผิว
และเนื้อหา การมีส่วนร่วมอีกเกี่ยวข้องกับการใช้ขั้นตอนการจัดกลุ่มเพื่อให้ matchingexample ที่ดีที่สุดจากฐานข้อมูล วิธีการนี้จะขึ้นอยู่กับการแบ่งส่วนของประโยคเป็นส่วนเชื่อมโยงกัน
และการจัดตำแหน่งของพวกเขาในระดับย่อย sentential.
1.2 วิธีการแปลไฮบริด
นักวิจัยหลายคนใช้ทั้งสองตามกฎและเป็นตัวอย่างที่ใช้วิธีการเป็นวิธีการไฮบริดของตัวเอง.
ราอิ et al. [ 3] เสนอวิธีการแปลไฮบริดใหม่ที่ผสมผสานตามกฎด้วยตัวอย่างที่ใช้
วิธีการ เค้าร่างของขั้นตอนวิธีไฮบริดคือ 1) หาประโยคที่ผู้สมัครที่มีความคล้ายคลึงกับการป้อนข้อมูล
ประโยค 2) เลือกแม่แบบ (ก) จัดอันดับโดยผู้สมัครที่มีความคล้ายคลึงกันในการป้อนข้อมูลประโยค (ข) กลุ่ม
การแปลประโยคผู้สมัคร ( c) การเลือกคู่อันดับสูงสุดของกลุ่มที่ดีที่สุด 3) แปล
ประโยคโดยการเปรียบเทียบกับเทมเพลทที่เลือก 4) การส่งออกที่ปรับประโยค สำหรับความแตกต่างของแต่ละคนพบ
มันและแปลโดยใช้โมดูลตามกฎ.
พวกเขาชี้ให้เห็นว่าระบบไฮบริดนี้เป็นวิธีการเลือกคุณสมบัติที่แข็งแกร่งของ rule-based และ
ตัวอย่างที่ใช้ในขณะที่หลีกเลี่ยงจุดอ่อนของพวกเขา จุดแข็งของวิธีการตามกฎที่ว่า
ข้อมูลที่สามารถได้รับผ่านทางวิปัสสนาและการวิเคราะห์ในขณะที่ตัวอย่างตามที่
จดหมายสามารถพบได้จากข้อมูลดิบ จุดอ่อนของวิธีการตามกฎก็คือความถูกต้อง
ของกระบวนการทั้งหมดเป็นผลิตภัณฑ์ของความถูกต้องของแต่ละขั้นตอนย่อย ความอ่อนแอของตัวอย่างที่ใช้
วิธีการคือความยากลำบากในการหาตัวอย่างที่เหมาะสม.
พวกเขายังสรุปได้ว่าระบบตัวอย่างที่ใช้ประโยชน์ควรจะสามารถที่จะยอมรับ corpora ชิดอย่างอิสระ
ไม่ได้เหล่านั้นสอดคล้องในระดับที่ต่ำ ต้นแบบของพวกเขา ระบบญี่ปุ่นภาษาอังกฤษผ่านการทดสอบโดยการแปลด้วย
คลัง 5,000 ประโยคสามารถใช้ข้อความที่สอดคล้องกันอย่างหลวม ๆ จะช่วยให้ผู้ใช้สามารถใช้ประโยชน์จากการใด ๆ ที่สอดคล้อง
กับข้อความที่พวกเขาได้โดยเพิ่มชุดของประโยคค้นหาโดยระบบ.
แม้ว่าวิธีการรวมเหล่านี้ทำงานที่ประสบความสำเร็จในระดับหนึ่งก็ไม่สามารถนำมาใช้โดยตรงกับ
ภาษาอังกฤษกับการแปลประโยคไทย เมื่อเทียบกับญี่ปุ่นและภาษาอังกฤษทั้งสองของพวกเขามีประโยค
เครื่องหมายและแต่ละคำในประโยคเป็นหมวดหมู่โดยหยุดหรือช่องว่างระหว่างคำ ดังนั้น
งานของการจัดตำแหน่งประโยคที่สามารถดำเนินการได้อย่างมีประสิทธิภาพ กระบวนการแปลตามหลักการของ
การเปรียบเทียบกับ corpora ใหญ่ของตำราขนานเป็นฐานข้อมูลที่ค่อนข้างประสบความสำเร็จและการแปลผล
มีความน่าเชื่อถือ ในทางตรงกันข้ามหนึ่งปัญหาภาษาศาสตร์อืดอาดของไทยมีการตัดคำเนื่องจากการทำงานของมัน
ประโยคที่ไม่มีเครื่องหมายเขตแดน จึงทำให้เกิดความยากลำบากในการจัดตำแหน่งประโยค ในฐานะที่เป็น
ผลให้เราไม่ได้มีปริมาณมากพอคลังประโยคชิดเป็นข้อมูลดิบเช่นตาม

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

1.1 กฎพื้นฐานและตัวอย่างตามแนวทาง
การแปลกฎส่วนใหญ่ประกอบด้วย ( 1 ) กระบวนการของการวิเคราะห์ข้อมูล ประโยคของภาษาจากการแหล่ง
, และ / หรือความหมายและ ( 2 ) กระบวนการผลิตผลผลิต
ประโยคของภาษาเป้าหมายขึ้นอยู่กับโครงสร้างภายในหรือภาษากลาง . แต่ละขั้นตอนจะถูกควบคุมโดย
พจนานุกรม และกฎ ในขณะเดียวกันแนวคิดพื้นฐานของตัวอย่างที่ใช้วิธีการแปลประโยค
โดยใช้การแปลประโยคตัวอย่างที่คล้ายกัน [ 1 ] ขั้นตอนหลักของตัวอย่างตามวิธีคือ 1 )
รวบรวมตัวอย่างในฐานข้อมูล 2 ) ให้ใส่ข้อมูลตัวอย่างที่คล้ายกันจากฐานข้อมูล และ 3 )
ปรับผลลัพธ์ของตัวอย่างที่คล้ายกับกระแสอินพุตและได้รับผลผลิต .
utsuro et al .[ 2 ] เสนอสืบค้นตัวอย่างวิธีเพื่อหลีกเลี่ยงการเต็มรูปแบบของตัวอย่าง
วิธีการสร้างการสอบถามจากความคล้ายคลึงกัน รับตัวอย่างผ่านต้นไม้
โครงสร้างของพจนานุกรมและจากนั้นใช้ไบนารีค้นหาตาม subsumption การสั่งซื้อของการสืบค้นสอบถาม .
cranias et al . [ ผม ] แนะนำวิธีการจับคู่ความเหมือนตามมาตรการทั้งโครงสร้างผิว
และเนื้อหา ผลงานอื่นที่เกี่ยวข้องกับการใช้งานของการจัดกลุ่มกระบวนการเพื่อให้ matchingexample ที่ดีที่สุดจากฐานข้อมูล วิธีนี้ต้องอาศัยการแบ่งส่วนของประโยคในส่วนติดต่อกัน และการจัดแนวของพวกเขาที่ย่อย

sentential ระดับ 1.2 วิธีการแปลลูกผสมหลายนักวิจัยใช้ทั้งกฎและตัวอย่างตามวิธีเป็นวิธีการของตนเอง ลูกผสม
ชิรา et al .

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.