2.2. Translation techniquesIt is wi

2.2. Translation techniques
It is widely recognized that there are three main approaches to translation in CLIR:
• Machine translation (MT).
• Translation by bilingual machine-readable dictionary (MRD).
• Parallel or comparable corpora-based methods.
436 K. Kishida / Information Processing and Management 41 (2005) 433–455
In addition some researchers have recently attempted to make use of WWW resources for obtaining
translation equivalents.
2.2.1. Machine translation techniques
Intuitively, the MT system seems to be a fine tool for CLIR, and actually, if good MT software is available,
the CLIR task becomes easier. However, in the case of query translation, the MT approach has not
always shown better performance than that of dictionary-based translation. For example, Ballesteros and
Croft (1998) reported that dictionary-based techniques outperformed a popular commercial MT system.
One of the reasons is that, as mentioned above, queries are often short and do not provide sufficient contextual
information for translation.More practically, a query is often represented as only a set of terms, and
it is difficult to expect MT systems to work well against such a poor representation. Also, MT systems usually
try to select only one translation from the many candidates that the source words may have. Nie, Simard,
Isabelle, and Durand (1999) pointed out that ‘‘by limiting the selection to only one word, the MT
process prevents the IR system from expanding the original query by synonyms or related words.’’
2.2.2. Dictionary-based methods
Using a bilingual MRD is the general approach for CLIR when no commercial MT system with an
established reputation is available. In general, most retrieval systems are still based on so-called ‘‘bag-ofwords’’
architectures, in which both query statements and document texts are decomposed into a set of
words (or phrases) through a process of indexing. Thus we can translate a query easily by replacing each
query term with its translation equivalents appearing in a bilingual dictionary or a bilingual term list.
Ballesteros and Croft (1997) first pointed out problems with this method as follows:
• Specialized vocabulary not contained in the dictionary will not be translated.
• Dictionary translations are inherently ambiguous and add extraneous information.
• Failure to translate multiterm concepts such as phrases reduces effectiveness.
These defects can be considered the main reasons for the degradation of CLIR performance in comparison
with that of mono-lingual retrieval, reported so far in the literature. For example, Hull and Grefenstette
(1996) stated that ‘‘. . .we learn that translation ambiguity and missing terminology are the two
primary sources of error. . .’’ Also, they reported that manual translation of multiword noun phrases contributes
to improvement of retrieval performance. This suggests the importance of translation of multiterm
concepts.
Many methods have been proposed for solving problems of term ambiguity and phrasal translation as
discussed later. Furthermore, the limitation of the coverage of dictionaries can be alleviated to a certain
degree by combining multiple resources such as other dictionaries or term lists generated from parallel
(or comparable) corpora (see also Section 5.3).
2.2.3. Parallel corpora-based method
Parallel or comparable corpora are useful resources enabling us to extract beneficial information for
CLIR. As mentioned already, the cross-language LSI approach makes use of this kind of corpus for constructing
a multidimensional indexing space.We can also obtain translation equivalents directly from a parallel
or comparable corpus. For example, in order to translate English queries into Spanish, Davis and
Dunning (1995) extracted moderately frequent Spanish terms from Spanish documents aligned with
English documents which had been searched using an English query (source query). A similar technique
was tested by Yang, Carbonell, Brown, and Frederking (1998) in which they applied a technique of
pseudo-relevance feedback to enhance the effectiveness of the search of the parallel corpus.
K. Kishida / Information Processing and Management 41 (2005) 433–455 437
Sheridan and Ballerini (1996), Braschler and Scha¨uble (2000, 2001) and Molina-Salgado, Moulinier,
Knudson, Lund, and Sekhon (2002) attempted to generate a similarity thesaurus from a comparable or parallel
corpus based on associations between each pair of terms, which are computed from statistics on the
number of documents in which both of the terms appear. The similarity thesaurus was used for obtaining
translation equivalents of source query terms through a kind of query expansion. Similarly, Yang et al.
(1998) empirically investigated the search performance of a method using a co-occurrence matrix of source
and target terms for the translation of query terms.
Similar approaches of generating a bilingual term list from a parallel or comparable corpus have also
been utilized by other researchers. For example, Chen, Gey, Kishida, Jiang, and Liang (1999) and Chen
(2002) employed the logarithm of the likelihood ratio, 2logk (Dunning, 1993) for measuring the association
between a source term and a target term. McNamee, Mayfield, and Piatko (2001) seem to use a measure
similar to mutual information (MI) for generating a bilingual term list from a parallel corpus. In
Adriani (2002), weights of English–Dutch term pairs were computed based on Jaccards coefficient formula.
On the other hand, some researchers in the CLIR field have attempted to estimate translation probability
from a parallel corpus according to a well-known algorithm developed by a research group at IBM (Brown
et al., 1993). The algorithm can automatically generate a bilingual term list with a set of probabilities that a
term is translated into equivalents in another language from a set of sentence alignments included in a parallel
corpus. The IBM algorithm includes five models, Model 1 through Model 5, of which Model 1 is the
simplest and is often used for CLIR. The fundamental idea of Model 1 is to estimate each translation probability
so that the probability represented such that
PðtjsÞ ¼
e
ðl þ 1Þm
Ym
j¼1
Xl
i¼0
PðtjjsiÞ
is maximized, where t is a sequence of terms t1, . . . , tm in the target language, s is a sequence of terms
s1, . . . , sl in the source language, P(tjjsi) is the translation probability, and e is a parameter (Brown et al.,
1993).
Franz, Scott McCarley, and Roukos (1999) employed a similar algorithm for estimating translation
probabilities between a pair of terms. Nie (1999) attempted to compare performance between the probabilistic
model, the dictionary-based approach and an MT system. Specifically, Nie et al. (1999) and Nie (2000)
explored a method for estimating translation probabilities using parallel texts extracted automatically from
the WWW. In addition, research groups employing the language model approach to CLIR (see below) have
often utilized the IBM algorithm for computing translation probabilities (e.g., Xu, Weischedel, & Nguyen,
2001; Kraaij, 2002, etc.).
Some issues on the use of the IBM model for CLIR were described extensively with actual examples in
Nie, Simard, and Foster (2001) and Nie and Simard (2002), e.g., translation of ambiguous words or compound
terms, and so on. In particular, Nie and Simard (2002) explored a technique of ‘‘two-direction translation’’
for solving the problem that some common words are often included as higher-ranked translations
of each query term. When these words are translated back to the source language, it is likely that they will
be translated in various ways. Thus, a combination of translation in both directions could eliminate useless
common words (however, the technique did not show good performance).
2.2.4. Use of WWW resources
As mentioned above, Nie et al. (1999) and Nie (2000) have employed WWW resources effectively for
constructing parallel corpora. Resnik (1999) has also challenged the issue of automatic generation of a parallel
corpus from the Web. The WWW can provide rich and ubiquitous machine-readable resources, from
which we may be able to automatically extract information useful for CLIR. For example, Chen (2002) and
Chen and Gey (2003) made use of a general search engine on the Internet and tried to find English trans-
438 K. Kishida / Information Processing and Management 41 (2005) 433–455
lation equivalents of Chinese or Japanese terms (mainly proper nouns) by analyzing contexts of these terms
in Chinese and Japanese Web documents returned by the engine. This method employs the fact that these
documents often include the English equivalents of certain terms, e.g., names of places or people. It seems
that there is room for applying a more sophisticated technique of natural language understanding in order
to extract useful information on translation from texts of Web pages.

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

2.2 เทคนิคการแปลมันเป็นที่ยอมรับว่า มีสามแนวทางหลักการแปลใน CLIR:•แปลภาษาด้วยเครื่อง (MT)•แปลตามพจนานุกรมสองภาษา machine-readable (MRD)•คู่ขนาน หรือเทียบ corpora ตามวิธีการKishida คุณ 436 / ประมวลผลข้อมูลและการจัดการ 41 (2005) 433-455นอกจากนี้ นักวิจัยบางแห่งพยายามใช้ WWW ทรัพยากรสำหรับการได้รับการแปลเทียบเท่านั้น2.2.1 การเทคนิคแปลภาษาด้วยเครื่องสังหรณ์ใจ ระบบ MT น่าจะ เป็นเครื่องมือที่ดีสำหรับ CLIR และที่ จริง ถ้าดี MT ได้งาน CLIR กลายเป็นง่าย อย่างไรก็ตาม ในกรณีของการแปลแบบสอบถาม วิธี MT ยังไม่เสมอแสดงประสิทธิภาพที่ดีกว่าของแปลตามพจนานุกรม ตัวอย่าง Ballesteros และCroft (1998) รายงานว่า เทคนิคใช้พจนานุกรม outperformed MT ระบบพาณิชย์นิยมหนึ่งในเหตุผลคือ ดังกล่าวข้างต้น แบบสอบถามมักสั้น และมีเพียงพอตามบริบทข้อมูลสำหรับการแปล ทางปฏิบัติ แบบสอบถามมักจะแสดงเป็นเพียงชุดของเงื่อนไข และเป็นการยากที่จะคาดหวังระบบ MT กับแสดงดีดี ยัง MT ระบบปกติพยายามเลือกแปลเดียวจากผู้สมัครจำนวนมากที่อาจมีคำมา Nie, Simardมะนิลา และ Durand (1999) ชี้ให้เห็นว่า '' โดยจำกัดการเลือกเพียงหนึ่งคำ MT ที่ไปกระบวนการป้องกันระบบ IR จากขยายแบบสอบถามต้นฉบับคำเหมือนหรือคำที่เกี่ยวข้อง ''2.2.2. พจนานุกรมตามวิธีใช้ MRD สองภาษาเป็นวิธีการทั่วไปสำหรับ CLIR เมื่อระบบ MT ไม่เชิงพาณิชย์ด้วยการชื่อเสียงได้ ทั่วไป ระบบเรียกส่วนใหญ่ยังคงอยู่เรียกว่า ''กระเป๋า-ofwords''สถาปัตยกรรม ซึ่งทั้งสองสอบถามรายงาน และเอกสารข้อความที่แยกเป็นชุดคำ (หรือวลี) ตลอดกระบวนการของการจัดทำดัชนี ดังนั้น เราสามารถแปลแบบสอบถามง่าย ๆ โดยแทนแต่ละคำถามกับเทียบเท่าแปลปรากฏในพจนานุกรมสองภาษาหรือรายระยะที่สองBallesteros และ Croft (1997) ก่อนชี้ให้เห็นปัญหาด้วยวิธีนี้ดังนี้:•คำศัพท์เฉพาะที่ไม่ประกอบด้วยในพจนานุกรมจะไม่สามารถแปล•พจนานุกรมแปลไม่มีความชัดเจน และเพิ่มข้อมูลที่ไม่เกี่ยวข้อง•ความล้มเหลวในการแปลแนวคิด multiterm เช่นวลีลดประสิทธิภาพข้อบกพร่องเหล่านี้สามารถเป็นเหตุผลหลักสำหรับการลดประสิทธิภาพของประสิทธิภาพการทำงาน CLIR ในการเปรียบเทียบที่เรียกโดยโมโน รายงานจนในวรรณคดี ตัวอย่าง ฮัลล์ Grefenstette(1996) ระบุที่ '' โธ่อีเรียนย่อแปลและคำศัพท์ที่หายไปสองแหล่งข้อมูลหลักของข้อผิดพลาด." '' ยัง พวกเขารายงานว่า multiword นามวลีแปลด้วยตนเองจัดสรรการปรับปรุงประสิทธิภาพการทำงานเรียก นี้ชี้ให้เห็นความสำคัญของการแปล multitermแนวคิดการได้รับการเสนอหลายวิธีสำหรับการแก้ปัญหาของคำย่อและ phrasal แปลเป็นกล่าวถึงในภายหลัง นอกจากนี้ สามารถ alleviated ข้อจำกัดของความครอบคลุมของพจนานุกรมเพื่อการบางอย่างระดับการรวมทรัพยากรต่าง ๆ เช่นพจนานุกรมหรือคำอื่น ๆ รายการที่สร้างขึ้นจากควบคู่กัน(หรือเป็นที่เปรียบเทียบได้) (ดูหัวข้อ 5.3) corpora2.2.3 การวิธีใช้ corpora ขนานCorpora ขนาน หรือเปรียบเทียบได้เป็นทรัพยากรที่มีประโยชน์ทำให้เราสามารถดึงข้อมูลที่เป็นประโยชน์สำหรับCLIR ดังกล่าวแล้ว การข้ามภาษา LSI วิธีทำให้คอร์พัสคริชนิดนี้ใช้สำหรับสร้างพื้นที่ดัชนีแบบหลายมิติ เรายังสามารถได้รับเทียบเท่าแปลโดยตรงจากคู่ขนานหรือคอร์พัสคริเปรียบเทียบได้ ตัวอย่าง การแปลแบบสอบถามภาษาอังกฤษเป็นภาษาสเปน Davis และDunning สเปนค่อนข้างบ่อย (1995) แยกเงื่อนไขจากสเปนเอกสารสอดคล้องกับเอกสารภาษาอังกฤษที่มีการค้นหาโดยใช้แบบสอบถามแบบภาษาอังกฤษ (ต้นฉบับแบบสอบถาม) เทคนิคที่คล้ายกันทดสอบ โดยยาง Carbonell น้ำตาล และ Frederking (1998) ที่พวกเขาใช้เทคนิคของความคิดเห็นเกี่ยวลกันเพื่อเพิ่มประสิทธิภาพของการค้นหาของคอร์พัสคริขนานคุณ Kishida / ประมวลผลข้อมูลและการจัดการ 41 (2005) 433-455 437เชอ และ Ballerini (1996), Braschler และ Scha¨uble (2000, 2001) และ Molina-Salgado, MoulinierKnudson ลุนด์ และ Sekhon (2002) พยายามสร้างอรรถาภิธานความคล้ายคลึงกันจากการเทียบเคียงหรือขนานคอร์พัสคริตามการเชื่อมโยงระหว่างแต่ละคู่ของเงื่อนไข ซึ่งคำนวณจากสถิติในการจำนวนของเอกสารทั้งสองเงื่อนไขปรากฏ อรรถาภิธานคล้ายถูกใช้สำหรับการได้รับเทียบเท่าแปลของแหล่งข้อสอบถามผ่านแบบสอบถามขยาย ในทำนองเดียวกัน ยาง et al(1998) empirically สอบสวนค้นหาประสิทธิภาพของวิธีการใช้เมทริกซ์การปรากฏร่วมของแหล่งและเงื่อนไขเป้าหมายสำหรับการแปลของเงื่อนไขของแบบสอบถามมีวิธีคล้ายสร้างรายการระยะสองจากคอร์พัสคริขนาน หรือเทียบเท่าถูกใช้ โดยนักวิจัยอื่น ๆ ตัวอย่าง เฉิน Gey, Kishida เจียง เหลียง (1999) และเฉิน(2002) จ้างลอการิทึมของอัตราส่วนความเป็นไปได้ 2logk (Dunning, 1993) สำหรับการวัดความสัมพันธ์ระหว่างคำต้นและคำเป้าหมาย McNamee เมย์ฟิลด์ และ Piatko (2001) ที่ดูเหมือนจะ ใช้การวัดข้อมูลคล้ายกับซึ่งกันและกัน (MI) สำหรับการสร้างรายการระยะสองจากคอร์พัสคริขนาน ในAdriani (2002), น้ำหนักของคำภาษาอังกฤษดัตช์คู่ถูกคำนวณตามสูตร Jaccard s สัมประสิทธิ์การบนมืออื่น ๆ นักวิจัยบางอย่างในฟิลด์ CLIR ได้พยายามประเมินความน่าเป็นการแปลจากคอร์พัสคริขนานตามอัลกอริทึมรู้จักพัฒนา โดยกลุ่มงานวิจัยที่ IBM (สีน้ำตาลร้อยเอ็ด al., 1993) อัลกอริทึมสามารถจะสร้างเป็นสองระยะรายการ ด้วยชุดของกิจกรรมที่มีคำแปลเทียบเท่าภาษาอื่นจากประโยคจัดแนวในคู่ขนานคอร์พัสคริ อัลกอริทึม IBM มีรุ่น 5 รุ่น 1 ถึงรุ่น 5 ซึ่งเป็นรุ่น 1ง่ายที่สุด และมักใช้สำหรับ CLIR ความคิดพื้นฐานของแบบจำลองคือการ ประเมินความน่าเป็นการแปลแต่ละเพื่อให้แสดงความน่าเป็นเช่นนั้นPðtjsÞ ¼อีðl þ 1ÞmYmj¼1Xli¼0PðtjjsiÞขยายใหญ่สุด t เป็น ลำดับของเงื่อนไข t1,..., tm ในภาษาเป้าหมาย s คือ ลำดับของเงื่อนไขs1,..., sl ในภาษาต้นฉบับ P(tjjsi) น่าแปล และอีเป็นพารามิเตอร์ (Brown et al.,1993)ฟรานซ์ สก็อต McCarley และ Roukos (1999) จ้างอัลกอริทึมที่เหมือนกันสำหรับการประเมินการแปลกิจกรรมระหว่างคู่ของเงื่อนไข พยายามเปรียบเทียบประสิทธิภาพระหว่างการ probabilistic Nie (1999)รูปแบบ วิธีใช้พจนานุกรม และระบบการ MT เฉพาะ Nie et al. (1999) และ Nie (2000)วิธีการประเมินกิจกรรมแปลด้วยข้อความแบบขยายโดยอัตโนมัติจากสำรวจWWW นอกจากนี้ มีกลุ่มวิจัยที่ใช้วิธีการแบบจำลองภาษา CLIR (ดูด้านล่าง)มักจะใช้อัลกอริทึม IBM สำหรับคอมพิวเตอร์กิจกรรมแปล (เช่น สี Weischedel และเห งียน2001 Kraaij, 2002 ฯลฯ .)บางปัญหาในการใช้รุ่น IBM CLIR ได้อธิบายไว้อย่างกว้างขวาง ด้วยตัวอย่างจริงNie, Simard และฟอสเตอร์ (2001) และ Nie และ Simard (2002), เช่น แปลคำกำกวม หรือผสมเงื่อนไข และอื่น ๆ โดยเฉพาะอย่างยิ่ง Nie และ Simard (2002) อุดมเทคนิค ''แปลทิศทาง 2 นิ้วการแก้ปัญหา คำทั่วไปมักจะรวมเป็นอันดับสูงแปลของแต่ละคำถาม เมื่อคำเหล่านี้มีแปลไปเป็นภาษาต้นฉบับ เป็นไปได้ว่า พวกเขาจะสามารถแปลในรูปแบบต่าง ๆ ดังนั้น ทั้งแปลทั้งสองทิศทางสามารถกำจัดประโยชน์คำทั่วไป (อย่างไรก็ตาม เทคนิคไม่ได้แสดงประสิทธิภาพที่ดี)2.2.4 การใช้ทรัพยากรใน WWWดังกล่าวข้างต้น Nie et al. (1999) และ Nie (2000) ได้จ้าง WWW ทรัพยากรได้อย่างมีประสิทธิภาพสร้าง corpora ขนาน Resnik (1999) นอกจากนี้ยังได้ท้าทายปัญหาของคู่ขนานคอร์พัสคริจากเว็บ WWW สามารถให้อุดมสมบูรณ์ machine-readable ทรัพยากร และ จากซึ่งเราอาจสามารถดึงข้อมูลที่มีประโยชน์สำหรับ CLIR โดยอัตโนมัติ ตัวอย่าง เฉิน (2002) และเฉิน Gey (2003) ทำการใช้การค้นหาทั่วไปเครื่องยนต์บนอินเทอร์เน็ต และพยายามที่จะค้นหาภาษาอังกฤษธุรกรรม-Kishida คุณ 438 / ประมวลผลข้อมูลและการจัดการ 41 (2005) 433-455เทียบเท่าเครื่องดูดของจีนหรือญี่ปุ่น (ส่วนใหญ่เป็นคำวิสามานยนาม) โดยการวิเคราะห์บริบทของข้อตกลงเหล่านี้ในเอกสารจีนและเว็บภาษาญี่ปุ่นที่ส่งคืน โดยเครื่องยนต์ วิธีนี้มีข้อเท็จจริงที่ว่าเหล่านี้เอกสารมักจะมีรายการเทียบเท่าภาษาอังกฤษของคำศัพท์ เช่น ชื่อของสถานหรือบุคคล ดูเหมือนว่าที่มีห้องใช้เทคนิคซับซ้อนขึ้นความเข้าใจภาษาธรรมชาติตามลำดับการแยกข้อมูลที่เป็นประโยชน์ในการแปลจากข้อความของเว็บเพจ

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

2.2 เทคนิคการแปล
เป็นที่ยอมรับกันอย่างกว้างขวางว่ามีสามวิธีหลักในการแปลใน CLIR:
. •เครื่องแปลภาษา (MT)
. •การแปลโดยเครื่องอ่านพจนานุกรมสองภาษา (MRD)
. •ขนานหรือเทียบเคียง corpora ตามวิธีการ
436 เค Kishida / การประมวลผลและการจัดการข้อมูล 41 (2005) 433-455
นอกจากนี้นักวิจัยบางคนเมื่อเร็ว ๆ นี้มีความพยายามที่จะทำให้การใช้ทรัพยากรละเอียดสำหรับการได้รับ
การแปลเทียบเท่า.
2.2.1 เทคนิคเครื่องแปล
สัญชาตญาณระบบมอนแทนาน่าจะเป็นเครื่องมือที่ดีสำหรับ CLIR และที่จริงถ้ามอนแทนาซอฟแวร์ที่ดีใช้ได้
งาน CLIR กลายเป็นเรื่องง่าย อย่างไรก็ตามในกรณีของการแปลแบบสอบถามวิธีมอนแทนายังไม่ได้
แสดงให้เห็นถึงประสิทธิภาพที่ดีขึ้นเสมอไปกว่านั้นแปลตามพจนานุกรม ตัวอย่างเช่นบาเยสเตรอและ
นา (1998) รายงานว่าเทคนิคตามพจนานุกรมเฮงมอนแทนาระบบการค้าที่เป็นที่นิยม.
หนึ่งในเหตุผลที่ว่าดังกล่าวข้างต้นแบบสอบถามมักจะสั้นและไม่ได้ให้เพียงพอตามบริบท
ข้อมูล translation.More จริง แบบสอบถามเป็นตัวแทนมักจะเป็นเพียงชุดของคำและ
มันเป็นเรื่องยากที่จะคาดหวังระบบมอนแทนาจะทำงานได้ดีกับการแสดงดังกล่าวที่น่าสงสาร นอกจากนี้ระบบมอนแทนามักจะ
พยายามที่จะเลือกเพียงหนึ่งการแปลจากผู้สมัครจำนวนมากที่แหล่งที่มาของคำว่าอาจจะมี Nie, มาร์ด,
อิสซาเบลและ Durand (1999) ชี้ให้เห็นว่า '' โดยการ จำกัด การเลือกเพียงหนึ่งคำ, มอนแทนา
กระบวนการป้องกันไม่ให้ระบบ IR จากการขยายแบบสอบถามต้นฉบับโดยคำพ้องความหมายหรือคำที่เกี่ยวข้อง. ''
2.2.2 วิธีการตามพจนานุกรม
ใช้ MRD สองภาษาเป็นวิธีการทั่วไปของ CLIR เมื่อไม่มีระบบมอนแทนาเชิงพาณิชย์ที่มี
ชื่อเสียงเป็นที่ยอมรับสามารถใช้ได้ โดยทั่วไปส่วนใหญ่ระบบการดึงจะขึ้นยังอยู่ในสิ่งที่เรียกว่า '' ถุง ofwords ''
สถาปัตยกรรมซึ่งทั้งสองงบการค้นหาเอกสารและข้อความจะถูกย่อยสลายเป็นชุดของ
คำ (หรือวลี) ผ่านกระบวนการของการจัดทำดัชนี ดังนั้นเราจึงสามารถแปลแบบสอบถามได้อย่างง่ายดายโดยการเปลี่ยนแต่ละ
. ระยะแบบสอบถามเทียบเท่ากับการแปลที่ปรากฏในพจนานุกรมสองภาษาหรือรายการคำภาษา
บาเยสเตรอและนา (1997) ครั้งแรกที่ชี้ให้เห็นปัญหาที่เกิดขึ้นด้วยวิธีการดังต่อไปนี้:
•คำศัพท์เฉพาะทางไม่ได้มีอยู่ใน พจนานุกรมจะไม่สามารถแปล.
•แปลภาษาไม่ชัดเจนโดยเนื้อแท้และเพิ่มข้อมูลภายนอก.
•ความล้มเหลวในการแปลแนวคิด multiterm เช่นวลีที่ลดประสิทธิภาพ.
ข้อบกพร่องเหล่านี้สามารถได้รับการพิจารณาในเหตุผลหลักสำหรับการย่อยสลายของประสิทธิภาพการทำงาน CLIR ในการเปรียบเทียบ
กับที่ของขาวดำ ดึงลิ้นรายงานเพื่อให้ห่างไกลในวรรณคดี ตัวอย่างเช่นฮัลล์และ Grefenstette
(1996) ระบุว่า '' . เราได้เรียนรู้ว่าความคลุมเครือแปลและคำศัพท์ที่ขาดหายไปเป็นสอง
แหล่งที่มาหลักของข้อผิดพลาด . . '' นอกจากนี้พวกเขารายงานว่าแปลคู่มือนามวลี multiword ก่อให้เกิด
การปรับปรุงประสิทธิภาพการดึง นี้แสดงให้เห็นถึงความสำคัญของการแปล multiterm
แนวคิด.
วิธีการหลายคนได้รับการเสนอในการแก้ปัญหาความคลุมเครือระยะและการแปลเป็นวลี
กล่าวถึงในภายหลัง นอกจากนี้ข้อ จำกัด ของความคุ้มครองของพจนานุกรมสามารถบรรเทาการบาง
ระดับโดยการรวมทรัพยากรหลายอย่างเช่นพจนานุกรมอื่น ๆ หรือรายการที่สร้างขึ้นจากระยะขนาน
(หรือเทียบเคียง) คลัง (ดูมาตรา 5.3).
2.2.3 วิธี corpora ตามขนาน
ขนานหรือเทียบเคียงคลังทรัพยากรที่มีประโยชน์จะทำให้เราสามารถดึงข้อมูลที่เป็นประโยชน์สำหรับ
CLIR ดังกล่าวแล้วข้ามภาษา LSI วิธีการทำให้การใช้ชนิดของคลังนี้ในการสร้าง
การจัดทำดัชนี space.We หลายมิติยังสามารถได้รับเทียบเท่าแปลโดยตรงจากขนาน
คลังหรือเทียบได้ ยกตัวอย่างเช่นในการสั่งซื้อที่จะแปลคำสั่งภาษาอังกฤษเป็นภาษาสเปน, เดวิสและ
การติดตามหนี้ (1995) สเปนสกัดแง่บ่อยปานกลางจากเอกสารภาษาสเปนสอดคล้องกับ
เอกสารภาษาอังกฤษที่ได้รับการค้นหาโดยใช้แบบสอบถามอังกฤษ (แหล่งที่มาของแบบสอบถาม) เทคนิคที่คล้ายกัน
ได้รับการทดสอบโดยยาง Carbonell, น้ำตาล, และ Frederking (1998) ที่พวกเขาใช้เทคนิคของการ
ตอบรับหลอกเกี่ยวข้องเพื่อเพิ่มประสิทธิภาพของการค้นหาของคลังขนาน.
เค Kishida / ข้อมูลการประมวลผลและการจัดการ 41 (2005) 433-455 437
เชอริแดนและ Ballerini (1996), และ Braschler Schäuble (2000, 2001) และ Molina-Salgado, Moulinier,
Knudson, ลุนด์และ Sekhon (2002) ความพยายามที่จะสร้าง พจนานุกรมคล้ายคลึงกันจากเทียบเคียงหรือขนาน
คลังขึ้นอยู่กับความสัมพันธ์ระหว่างคู่ของแต่ละคำที่มีการคำนวณจากสถิติเกี่ยวกับ
จำนวนของเอกสารซึ่งทั้งสองคำที่ปรากฏ พจนานุกรมคล้ายคลึงกันถูกนำมาใช้สำหรับการได้รับ
เทียบเท่าแปลของคำแบบสอบถามผ่านชนิดแหล่งที่มาของการขยายตัวแบบสอบถาม ในทำนองเดียวกันยาง et al.
(1998) สังเกตุการตรวจสอบประสิทธิภาพการทำงานของการค้นหาวิธีการที่ใช้เมทริกซ์ร่วมการเกิดขึ้นของแหล่งที่มา
และเงื่อนไขเป้าหมายสำหรับการแปลของคำแบบสอบถาม.
วิธีการที่คล้ายกันในการสร้างรายการคำภาษาจากคลังขนานหรือเทียบเคียงได้ ยัง
ถูกนำมาใช้โดยนักวิจัยอื่น ๆ ตัวอย่างเช่นเฉิน Gey, Kishida เจียงและเหลียง (1999) และเฉิน
(2002) การจ้างงานลอการิทึมของอัตราส่วน? 2logk (Dunning, 1993) สำหรับการวัดความสัมพันธ์
ระหว่างแหล่งที่มาและระยะยาวเป้าหมาย McNamee, Mayfield และ Piatko (2001) ดูเหมือนจะใช้มาตรการ
ที่คล้ายกับข้อมูลร่วมกัน (MI) สำหรับการสร้างรายการคำภาษาจากคลังขนาน ใน
Adriani (2002), น้ำหนักของคู่คำภาษาอังกฤษดัตช์ถูกคำนวณขึ้นอยู่กับ Jaccard? สูตรสัมประสิทธิ์.
ในทางตรงกันข้ามนักวิจัยบางคนในเขต CLIR ได้พยายามที่จะประเมินความน่าจะแปล
จากคลังขนานตามที่รู้จักกันดี อัลกอริทึมที่พัฒนาโดยกลุ่มวิจัยที่ IBM (สีน้ำตาล
et al., 1993) อัลกอริทึมโดยอัตโนมัติสามารถสร้างรายการคำภาษากับชุดของความน่าจะเป็นว่า
คำที่แปลเป็นเทียบเท่าในภาษาอื่นจากชุดของการจัดแนวประโยครวมอยู่ในขนาน
คลัง อัลกอริทึมของไอบีเอ็มรวมถึงห้ารุ่นรุ่นที่ 1 ถึงรุ่นที่ 5 ซึ่งรุ่นที่ 1 เป็น
ที่ง่ายและมักจะใช้สำหรับการ CLIR ความคิดพื้นฐานของรุ่น 1 คือการประเมินความน่าจะแปลแต่ละคน
เพื่อให้เป็นตัวแทนของความน่าจะเป็นเช่นนั้น
PðtjsÞ¼
อี
DL þ1Þm
Ym
j¼1
Xl
i¼0
PðtjjsiÞ
สูงสุดที่เสื้อเป็นลำดับของคำ t1, . . , TM ในภาษาเป้าหมายคือลำดับของคำ
s1, . . , sl ในภาษาต้นฉบับ, P (tjjsi) เป็นความน่าจะแปลและ e เป็นพารามิเตอร์ (สีน้ำตาล et al.,
1993).
ฟรานซ์, สกอตต์ McCarley และ Roukos (1999) การจ้างงานขั้นตอนวิธีการที่คล้ายกันสำหรับการประเมินการแปล
ความน่าจะเป็นระหว่าง คู่ของข้อตกลง Nie (1999) พยายามที่จะเปรียบเทียบประสิทธิภาพระหว่างความน่าจะเป็น
รูปแบบวิธีการตามพจนานุกรมและระบบมอนแทนา โดยเฉพาะ Nie et al, (1999) และ Nie (2000)
การสำรวจวิธีการสำหรับการประเมินความน่าจะเป็นการแปลโดยใช้ตำราขนานสกัดโดยอัตโนมัติจาก
WWW นอกจากนี้กลุ่มวิจัยการใช้วิธีการรูปแบบภาษาที่ CLIR (ดูด้านล่าง) ได้
มักจะใช้อัลกอริทึมของไอบีเอ็มสำหรับการคำนวณความน่าจะแปล (เช่นเสี่ยว Weischedel และเหงียน
2001; Kraaij 2002 ฯลฯ ).
ในบางประเด็น การใช้รูปแบบของไอบีเอ็มสำหรับ CLIR ถูกอธิบายอย่างกว้างขวางกับตัวอย่างที่เกิดขึ้นจริงใน
Nie, มาร์ดและฟอสเตอร์ (2001) และ Nie และมาร์ด (2002) เช่นแปลของคำที่ไม่ชัดเจนหรือสาร
คำและอื่น ๆ โดยเฉพาะอย่างยิ่ง Nie และมาร์ด (2002) สำรวจเทคนิคของ '' แปลสองทิศทาง ''
สำหรับการแก้ปัญหาที่คำทั่วไปบางอย่างจะรวมมักจะเป็นคำแปลการจัดอันดับที่สูงขึ้น
ของแต่ละคำที่สืบค้น เมื่อคำพูดเหล่านี้จะถูกแปลงกลับไปยังแหล่งภาษาก็มีโอกาสที่พวกเขาจะ
ได้รับการแปลในรูปแบบต่างๆ ดังนั้นการรวมกันของการแปลทั้งสองทิศทางสามารถกำจัดไร้ประโยชน์
คำทั่วไป (แต่เทคนิคที่ไม่ได้แสดงผลงานที่ดี).
2.2.4 การใช้ทรัพยากรละเอียด
ดังกล่าวข้างต้น Nie et al, (1999) และ Nie (2000) มีการจ้างงานทรัพยากร WWW อย่างมีประสิทธิภาพสำหรับ
การสร้างคลังข้อมูลแบบขนาน Resnik (1999) นอกจากนี้ยังได้ท้าทายปัญหาของการผลิตอัตโนมัติของขนาน
คลังจากเว็บ รายละเอียดสามารถให้ทรัพยากรที่อุดมสมบูรณ์และเครื่องอ่านแพร่หลายจาก
ที่เราอาจจะสามารถดึงข้อมูลโดยอัตโนมัติที่มีประโยชน์สำหรับ CLIR ตัวอย่างเช่นเฉิน (2002) และ
เฉินและ Gey (2003) ทำให้การใช้เครื่องมือค้นหาทั่วไปบนอินเทอร์เน็ตและพยายามที่จะหาทรานส์ภาษาอังกฤษ
438 เค Kishida / ข้อมูลการประมวลผลและการจัดการ 41 (2005) 433-455
เทียบเท่า lation ของ แง่จีนหรือญี่ปุ่น (ส่วนใหญ่เป็นคำนามที่เหมาะสม) โดยการวิเคราะห์บริบทของคำเหล่านี้
ในเอกสารเว็บจีนและญี่ปุ่นที่ส่งกลับโดยเครื่องยนต์ วิธีนี้ใช้ความจริงที่ว่าเหล่านี้
มักจะมีเอกสารที่เทียบเท่าภาษาอังกฤษของคำบางคำเช่นชื่อสถานที่หรือคน ดูเหมือน
ว่ามีห้องพักสำหรับการใช้เทคนิคที่ซับซ้อนมากขึ้นของความเข้าใจภาษาธรรมชาติเพื่อที่
จะดึงข้อมูลที่เป็นประโยชน์ในการแปลจากตำราของหน้าเว็บ

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

2.2 . เทคนิคการแปล
มันได้รับการยอมรับอย่างกว้างขวางว่ามี 3 วิธีหลักใน clir แปลแปลภาษา :
-
- ( MT ) แปลโดยรหัสสองภาษาพจนานุกรม ( MRD )
- ขนานหรือเทียบเท่าคลังข้อมูลตามวิธี คุณ K .
คิชิดะ / การประมวลผลข้อมูลและการจัดการ 41 ( 2005 ) 433 – 455
นอกจากนี้นักวิจัยบางคนได้เมื่อเร็ว ๆนี้พยายามที่จะใช้ทรัพยากรของเวิลด์ไวด์เว็บเพื่อขอรับ

ส่วนแปล ร . เทคนิคการแปลภาษา
สังหรณ์ใจ , ระบบตัน ดูเหมือนว่าจะเป็นเครื่องมือที่ดีสำหรับ clir และจริงๆ แล้วถ้าดีตันซอฟต์แวร์สามารถใช้ได้
clir กลายเป็นงานง่ายขึ้น อย่างไรก็ตาม ในกรณีของการแปลแบบสอบถามวิธีการไม่ได้
)เสมอแสดงประสิทธิภาพที่ดีขึ้นกว่าที่ของจากพจนานุกรมแปล ตัวอย่างเช่น Ballesteros และ
Croft ( 2541 ) รายงานว่า พจนานุกรมพื้นฐานเทคนิคในระบบพาณิชย์นิยม ) .
เหตุผลหนึ่งคือว่า ตามที่กล่าวไว้ข้างต้น แบบสอบถามมักจะสั้นและไม่ได้ให้ข้อมูลบริบท
เพียงพอสำหรับการแปล มากกว่าจริงแบบสอบถามมักจะแสดงเป็นเพียงชุดของเงื่อนไขและ
มันเป็นเรื่องยากที่จะคาดหวังระบบ MT ทำงานได้ดีกับการแสดงแบบนี้น่าสงสาร นอกจากนี้ ตันระบบมักจะ
พยายามที่จะเลือกเพียงหนึ่ง แปล จากผู้สมัครหลายที่ที่มาคำอาจ ไม่ , ซีเมิร์ด
, เบล และ ดูแรน ( 1999 ) ชี้ให้เห็นว่า ' 'by การจํากัดการ เพียงหนึ่งคํา MT
กระบวนการป้องกันระบบ IR จากขยายเดิมแบบสอบถามโดยพ้อง หรือที่เกี่ยวข้องกับคำ ' '
2.2.2 . พจนานุกรมตามวิธีการ
ใช้ MRD สองภาษาเป็นวิธีการทั่วไปสำหรับ clir เมื่อไม่ตันระบบพาณิชย์กับ
สร้างชื่อเสียงเป็นใช้ได้ โดยทั่วไปมากที่สุดกู้คืนระบบจะยังคงขึ้นอยู่กับ 'bag-ofwords ที่เรียกว่า ' ' '
สถาปัตยกรรม ,ซึ่งทั้งแบบสอบถามและเอกสารที่เป็นข้อความข้อความย่อยสลายลงในชุดของ
คำ ( หรือวลี ) ผ่านกระบวนการของการสร้างดัชนี . ดังนั้น เราสามารถแปลแบบสอบถามได้อย่างง่ายดายโดยการเปลี่ยนระยะของแบบสอบถามแต่ละ
แปลซึ่งปรากฏในพจนานุกรมสองภาษาหรือรายการคำสองภาษา
Ballesteros และ Croft ( 1997 ) ครั้งแรกชี้ให้เห็นปัญหาด้วยวิธีนี้ ดังนี้
- ไม่เฉพาะคำศัพท์ที่มีอยู่ในพจนานุกรม จะได้ไม่ต้องแปล
- พจนานุกรมการแปลเป็นอย่างโดยเนื้อแท้ที่ไม่ชัดเจนและเพิ่มข้อมูลที่ไม่เกี่ยวข้อง
- ความล้มเหลวที่จะแปล multiterm แนวคิดเช่นวลีลดประสิทธิผล .
ข้อบกพร่องเหล่านี้ก็ถือเป็นเหตุผลหลักในการย่อยสลายของความสามารถในการ clir
กับของโมโนภาษาสืบค้นรายงานเพื่อให้ห่างไกลในวรรณคดี เช่น เรือ และ grefenstette
( 1996 ) กล่าวว่า ' ' . . . . . . . เราได้เรียนรู้ว่า แปลคำศัพท์ความคลุมเครือ และหายไปเป็นสอง
แหล่งที่มาหลักของข้อผิดพลาด . . . . . . . ' ' ยังได้รายงานว่า แปลคู่มือ multiword นามวลีมีส่วนช่วย
เพื่อการปรับปรุงประสิทธิภาพของคำค้น นี้แสดงให้เห็นความสำคัญของการแปลของแนวคิด multiterm

หลายวิธีได้ถูกเสนอเพื่อแก้ไขปัญหาในระยะยาวและเป็นกริยาวลีแปล
กล่าวถึงในภายหลัง นอกจากนี้ ข้อจำกัดของความคุ้มครองของพจนานุกรมที่สามารถบรรเทาในระดับหนึ่ง
โดยรวมทรัพยากรต่างๆ เช่น พจนานุกรม หรือรายการที่สร้างขึ้นจากระยะขนาน
( หรือเทียบเท่า ) คลังข้อมูล ( ดู มาตรา 5.3 )
2.2.3 . คลังข้อมูลแบบขนานโดยใช้วิธี
ขนาน หรือเทียบเท่ากับคลังข้อมูลเป็นประโยชน์ทรัพยากรให้เราสามารถดึงข้อมูลที่เป็นประโยชน์สำหรับ
clir . ดังที่ได้กล่าวแล้ว ข้ามภาษา LSI วิธีการทำให้การใช้ชนิดนี้ของข้อมูลเพื่อสร้างดัชนี
พื้นที่หลายมิติ นอกจากนี้เรายังสามารถได้รับการแปลโดยตรงจากเทียบเท่าขนาน
หรือเทียบเท่าคลังข้อมูล ตัวอย่างเช่นเพื่อที่จะแปลแบบสอบถามภาษา : ภาษาอังกฤษ เป็น ภาษาสเปน , เดวิสและ
ดันนิ่ง ( 1995 ) สกัดบ่อยพอสมควร สเปน ด้านเอกสารจากสเปนที่สอดคล้องกับเอกสารที่ได้รับการค้นหา
ภาษาอังกฤษโดยใช้แบบสอบถามภาษาอังกฤษ ( แหล่งข้อมูล ) เป็นเทคนิคที่คล้ายกัน
ทดสอบด้วยยาง คาร์โบเนล น้ำตาล และ frederking ( 1998 ) ที่พวกเขาใช้เทคนิค
เทียม , ข้อเสนอแนะเพื่อเพิ่มประสิทธิภาพของการค้นหาของคลังข้อมูลแบบขนาน
K . คิชิดะ / การประมวลผลข้อมูลและการจัดการ 41 ( 2005 ) และ 433 – 455 437
เชอริแดน ballerini ( 1996 ) และตั้ง braschler scha Concepcin ( 2000 , 2001 ) และโมลินา salgado moulinier
นูดสัน , , , ( 2002 sekhon ลันด์ และ ) พยายามที่จะสร้างความคล้ายคลึงเปรียบหรือขนาน
พจนานุกรมจากข้อมูลจากสมาคมระหว่างคู่ของแต่ละส่วน ซึ่งคำนวณจากสถิติ
จำนวนเอกสารที่ทั้งในแง่ที่ปรากฏ ความเหมือนของพจนานุกรมถูกใช้เพื่อขอรับ
แปลไปสู่แหล่งสอบถามเงื่อนไขผ่านชนิดของการสอบถาม ในทำนองเดียวกัน หยาง et al .
( 1998 ) จากผลตรวจสอบประสิทธิภาพการค้นหาของวิธีการใช้เมทริกซ์ของแหล่ง
และข้อตกลงเป้าหมายสำหรับการแปลคำสอบถาม วิธีการสร้างรายการที่คล้ายกัน
เทอมสอง ขนาน หรือ เทียบเท่าจากคลังข้อมูลยัง
ถูกใช้โดยนักวิจัยอื่น ๆ ตัวอย่างเช่น เฉิน เกย์ คิชิดะ เจียง และ เหลียง ( 1999 ) และเฉิน
( 2002 ) ใช้ลอการิทึมของอัตราส่วนความน่าจะเป็น 2logk ( ดันนิ่ง 1993 ) วัดสมาคม
ระหว่างระยะแหล่งที่มาและเป้าหมายระยะยาว แม็กเนอมี่เมย์ฟิลด์ , และ piatko ( 2001 ) ดูเหมือนจะใช้วัด
คล้ายกับข้อมูลซึ่งกันและกัน ( MI ) สำหรับการสร้างรายการคำสองภาษาจากคลังข้อมูลแบบขนาน ใน
ริ นี่ ( 2002 )น้ำหนักของดัตช์ภาษาอังกฤษ–ระยะคู่ถูกคำนวณบนพื้นฐานของสูตร Jaccard coefficient .
บนมืออื่น ๆ , นักวิจัยบางใน clir ฟิลด์ ได้พยายามที่จะประมาณการ
ความน่าจะเป็นแปลจากคลังข้อมูลแบบขนานตามที่รู้จักกันดีขั้นตอนวิธีที่พัฒนาโดยกลุ่มงานวิจัยที่ IBM ( สีน้ำตาล
et al . , 1993 )วิธีสามารถโดยอัตโนมัติสร้างรายการคำสองภาษาที่มีชุดของความน่าจะเป็นที่
คําแปลเป็นเทียบเท่าในภาษาอื่นจากชุดสองประโยคที่รวมอยู่ในคลังข้อมูลแบบขนาน

สำหรับขั้นตอนวิธีรวมถึงห้ารุ่น รุ่น 1 ถึงรุ่นที่ 5 ของรุ่นที่ 1 คือ
ที่ง่ายที่สุดและมักจะใช้สำหรับ clir .แนวคิดพื้นฐานของแบบจำลองที่ 1 ประเมินการแปลแต่ละความน่าจะเป็น
ดังนั้นความน่าจะเป็นแสดงเช่น
P ð . Þ¼
e
ðผมþ 1 Þ m
)

1 J ¼ XL ผม¼ 0
P ð tjjsi Þ
เป็น maximized ซึ่งเป็นลำดับของข้อตกลง T1 t , . . . . . . . . ตัวในภาษาเป้าหมายเป็นลำดับของข้อตกลง
S1 , . . . . . . . . SL ในภาษาต้นฉบับ , P ( tjjsi ) คือ การแปลความและ E เป็นพารามิเตอร์ ( สีน้ำตาล et al . , 1993

)ฟรานซ์ สก็อต แมคคาเลย์ และ roukos ( 1999 ) ใช้วิธีคล้ายการแปล
ความน่าจะเป็นระหว่างคู่ของเงื่อนไข หนี่ ( 1999 ) พยายามที่จะเปรียบเทียบประสิทธิภาพระหว่างแบบจำลองความน่าจะเป็น
, พจนานุกรมตามวิธีการและตันระบบ โดยเฉพาะ ไม่ et al . ( 1999 ) และ หนี่ ( 2000 )
หาวิธีการในการประมาณค่าความน่าจะเป็นแปลข้อความที่สกัดโดยอัตโนมัติจากการใช้ขนาน
www . นอกจากนี้ กลุ่มงานวิจัยการใช้รูปแบบภาษาวิธีการ clir ( ดูด้านล่าง ) มี
ใช้มักจะขั้นตอนวิธีสำหรับการคำนวณความน่าจะเป็นสำหรับการแปล ( เช่น Xu , weischedel &เหงียน
, 2001 ; kraaij , 2002 , ฯลฯ ) .
มีปัญหาเกี่ยวกับการใช้ IBM แบบ clir ถูกอธิบายอย่างกว้างขวางกับที่เกิดขึ้นจริงตัวอย่าง
ไม่ได้ , ซีเมิร์ด และ ฟอสเตอร์ ( 2001 ) และ ไม่ และ ซีเมิร์ด ( 2002 ) , เช่น , แปลคำที่คลุมเครือหรือเงื่อนไขผสม
, และอื่น ๆ โดยเฉพาะ ไม่ซีเมิร์ด ( 2002 ) และสํารวจเทคนิค ' ' '
'two-direction แปลเพื่อแก้ไขปัญหาที่พบมักเป็นคำรวมที่สูงขึ้นการจัดอันดับแปล
ของแต่ละแบบสอบถามในระยะ เมื่อคำเหล่านี้แปลกลับไปภาษาต้นฉบับ มีโอกาสที่พวกเขาจะ
ได้รับการแปลในรูปแบบต่างๆ ดังนั้นการรวมกันของการแปลในทั้งสองทิศทาง สามารถกำจัดไร้ประโยชน์
ทั่วไปคำ ( อย่างไรก็ตาม เทคนิคไม่ได้แสดงประสิทธิภาพที่ดี )
2.2.4 .การใช้ทรัพยากรของ www
ดังกล่าวข้างต้น หนี่ et al . ( 1999 ) และ หนี่ ( 2000 ) ได้ใช้ทรัพยากรได้อย่างมีประสิทธิภาพ สร้าง www
คลังข้อมูลแบบขนาน เรสนิก ( 1999 ) ยังท้าทายปัญหาของรุ่นอัตโนมัติของข้อมูลแบบขนาน
จากเว็บ WWW สามารถให้รวย และพัฒนาทรัพยากรรหัสจาก
ซึ่งเราอาจจะโดยอัตโนมัติดึงข้อมูลที่เป็นประโยชน์สำหรับ clir . ตัวอย่างเช่น เฉิน ( 2002 )
เฉินและ เกย์ ( 2003 ) ได้ใช้เครื่องมือค้นหาทั่วไปบนอินเทอร์เน็ตและพยายามที่จะค้นหา trans - ภาษาอังกฤษ
438 K . คิชิดะ / การประมวลผลข้อมูลและการจัดการ 41 ( 2005 ) 433 – 455
lation ไปสู่จีน หรือญี่ปุ่น ข้อตกลง ( คำนามส่วนใหญ่ที่เหมาะสม ) โดยการวิเคราะห์บริบท
ของเงื่อนไขเหล่านี้ในจีนและญี่ปุ่น เอกสารเว็บที่ส่งกลับโดยเครื่องยนต์ วิธีนี้ใช้ความจริงที่ว่า เอกสารเหล่านี้
มักจะรวมภาษาอังกฤษเทียบเท่าของเงื่อนไขบางอย่าง เช่น ชื่อ สถานที่ หรือคน ดูเหมือนว่า
ว่ามีห้องสำหรับการใช้เทคนิคที่ซับซ้อนมากขึ้นของภาษาธรรมชาติ ความเข้าใจ ในการดึงข้อมูลที่เป็นประโยชน์บน
แปลจากข้อความของหน้าเว็บ

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.