4.2.3. Information extractionOne of

4.2.3. Information extraction
One of the intuitive ways to perform this task is to provide
hand-written regular expressions (REs) like [59,60]. The results are promising but the number of manually-written REs
(165 REs for a 9-concept ontology [59]) makes it hard to handle. More, their approach does not focus on scalability unlike
[61,40] who propose a REs pattern-based tool named OnTeA.
OnTeA takes advantage of Hadoop MapReduce to scale. More and
more, automatic approaches had been proposed. It is the case
of KNOWITALL [62] and TextRunner. The former uses predefined
patterns and rule templates to populate classes in a given ontology. Though automatic, KNOWITALL does not scale: a webdocument is processed several times for patterns matching
and many web-queries are done to assign a probability to a
concept, etc. Thus, TextRunner which implements the new
extraction paradigm of Open Information Extraction (OIE) had
been introduced. In OIE, we are not limited in a set of triples
but try to extract all of them [8,47]. More recently, following
REVERB, [63] present OLLIE. Unlike REVERB, OLLIE can extract relation not mediated by verb and in certain case can provide
the context of a relation (e.g: “If he wins five key states, Romney will be elected President.” −→ (the wining of key states determines the election fact)).

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

4.2.3. ด่วนวิธีง่ายในการทำงานนี้อย่างใดอย่างหนึ่งคือการให้ลายมือนิพจน์ทั่วไป (ทรัพยากร) เช่น [59,60] ผลการมีแนวโน้มแต่จำนวนคำที่เขียนด้วยตนเอง(165 ทรัพยากรสำหรับภววิทยา 9 แนวคิด [59]) ทำให้ยากที่จะจัดการ เพิ่มเติม วิธีไม่เน้นภาระแตกต่างจาก[61,40] ที่เสนอความละเอียดตามรูปแบบเครื่องมือที่ชื่อ OnTeAOnTeA ใช้ประโยชน์ของ Hadoop MapReduce เพื่อปรับขนาด เพิ่มเติม และมีการเสนอแนวทางเพิ่มเติม อัตโนมัติ เป็นกรณีKNOWITALL [62] และ TextRunner ใช้เดิมที่กำหนดไว้ล่วงหน้ารูปแบบและแม่แบบกฎเพื่อใส่ชั้นในภววิทยากำหนด ว่าอัตโนมัติ KNOWITALL ขนาด: webdocument การประมวลผลหลายครั้งสำหรับรูปแบบที่ตรงกันและแบบสอบถามเว็บที่มากจะทำการกำหนดความน่าเป็นเพื่อการแนวคิด ฯลฯ ดังนั้น TextRunner ซึ่งใช้ใหม่ได้สกัดกระบวนทัศน์ของการสกัดข้อมูลเปิด (ต้อง)รับการแนะนำ ในต้อง เราจะไม่จำกัดเฉพาะในชุดของ triplesแต่พยายามที่จะดึงทั้งหมดของพวกเขา [8,47] เมื่อเร็ว ๆ นี้ ต่อไปนี้ก้อง OLLIE ปัจจุบัน [63] ซึ่งแตกต่างจากเสียงสะท้อน OLLIE สามารถแยกความสัมพันธ์ไม่มี โดยคำกริยา และในบางกรณีสามารถให้บริบทของความสัมพันธ์ (เช่น: −→ "ถ้าเขาชนะอเมริกาหลักห้า Romney จะเลือกตั้งประธานาธิบดี" (วินนิ่งของอเมริกาที่สำคัญกำหนดเลือกตั้งจริง))

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

4.2.3 การสกัดข้อมูล
หนึ่งในวิธีที่ง่ายในการดำเนินการนี้คือการให้
การแสดงออกปกติที่เขียนด้วยมือ (REs) เช่น [59,60] ผลลัพธ์ที่ได้จะมีแนวโน้ม แต่จำนวนโลว์ด้วยตนเองเขียน
(165 REs สำหรับอภิปรัชญา 9-CONCEPT [59]) ทำให้ยากที่จะจัดการ เพิ่มเติมวิธีการของพวกเขาไม่ได้มุ่งเน้นขยายขีดความสามารถแตกต่างจาก
[61,40] ที่นำเสนอเครื่องมือ REs รูปแบบตามชื่อ OnTeA.
OnTeA ใช้ประโยชน์จาก Hadoop MapReduce จะไต่ มากขึ้นและ
มากขึ้นวิธีการอัตโนมัติได้รับการเสนอชื่อ เป็นกรณี
ของ KNOWITALL [62] และ TextRunner อดีตที่กำหนดไว้ล่วงหน้าใช้
รูปแบบและแม่แบบการปกครองเพื่อเติมชั้นเรียนในอภิปรัชญาที่กำหนด แม้ว่าอัตโนมัติ KNOWITALL ไม่ได้ระดับที่: webdocument มีการประมวลผลหลายครั้งสำหรับรูปแบบการจับคู่
และหลายเว็บแบบสอบถามจะดำเนินการเพื่อกำหนดความน่าจะเป็นกับ
แนวคิดเป็นต้นดังนั้น TextRunner ซึ่งดำเนินการใหม่
กระบวนทัศน์การสกัดเปิดสกัดสารสนเทศ (OIE) ได้
รับการแนะนำ ใน OIE เราไม่ได้ จำกัด อยู่ในชุดของอเนกประสงค์
แต่พยายามที่จะดึงทั้งหมดของพวกเขา [8,47] เมื่อเร็ว ๆ นี้ต่อไป
พัดโบก [63] Ollie ปัจจุบัน ซึ่งแตกต่างจากพัดโบก Ollie สามารถแยกความสัมพันธ์ไม่ไกล่เกลี่ยโดยคำกริยาและในกรณีที่บางอย่างสามารถให้
บริบทของความสัมพันธ์ (เช่น: - → (วินนิ่งของรัฐที่สำคัญในการกำหนด "ถ้าเขาชนะห้ารัฐที่สำคัญรอมนีย์จะได้รับการเลือกตั้งเป็นประธานาธิบดี." การเลือกตั้งจริง))

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

4.2.3 . การสกัดข้อมูลหนึ่งในวิธีที่ง่ายเพื่อดำเนินการงานนี้ให้มือเขียนนิพจน์ปกติ ( RES ) เช่น [ 59,60 ] ผลลัพธ์ที่ได้จะสดใส แต่จำนวนของตนเองเขียน res( 165 res สำหรับ 9-concept อภิปรัชญา [ 59 ] ) ทำให้ยากที่จะจัดการ เพิ่มเติม วิธีการของพวกเขาไม่เน้น scalability ซึ่งแตกต่างจาก[ 61,40 ] ที่เสนอรูปแบบโดยใช้เครื่องมือที่ชื่อ ontea res .ontea ใช้ประโยชน์จาก Hadoop mapreduce ขนาด มากขึ้น และเพิ่มเติมวิธีการโดยอัตโนมัติได้รับการเสนอ มันเป็นคดีของ knowitall [ 62 ] และ textrunner . อดีตใช้ที่กำหนดไว้ล่วงหน้ารูปแบบและแม่แบบกฎเพื่อใส่ในชั้นเรียนให้ภววิทยา . แม้ว่าอัตโนมัติ knowitall ไม่ได้ขนาด : webdocument การประมวลผลหลายๆ ครั้ง สำหรับรูปแบบการจับคู่และแบบสอบถามหลายเว็บจะทำให้โอกาสที่จะเป็นแนวคิด ฯลฯ ดังนั้น textrunner ซึ่งใช้ใหม่การสกัดกระบวนทัศน์ของการสกัดข้อมูล ( OIE ) ได้เปิดแนะนำตัว ในองค์กรที่ เราไม่ จำกัด ในการตั้งค่าของอเนกประสงค์แต่พยายามที่จะดึงพวกเขาทั้งหมด [ 8,47 ] เมื่อเร็วๆ นี้ ดังต่อไปนี้เสียงสะท้อน [ 63 ] ปัจจุบัน ออลลี่ ซึ่งแตกต่างจาก reverb , ออลลี่สามารถแยกความสัมพันธ์ไม่ได้ ) โดยกริยา และในบางกรณีสามารถให้บริบทของความสัมพันธ์ ( เช่น : " ถ้าเขาชนะห้า Key อเมริกา รอมนีย์จะเลือกประธาน " −→ ( วินนิ่งของรัฐหลักกำหนดเลือกตั้งจริง ) )

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.