4.2.5. Ontology populationSince inf

4.2.5. Ontology population
Since information has been extracted and synonyms identified,
our unstructured data must be put in computerprocessable
form. The current task thus consists in organizing
extracted tuples in a querying form such as instances
of ontologies, tuples of a database schema or set of quads
(< subject, predicate, object, context >). This idea is found in
[59–61,40] but uses several hand-written regular expressions.
It is also found in [76]’s On-demand IE approach and in [77]
where they propose a method to map triples output from
an OIE process to a domain-ontology. The former approach
chooses to escape from an expensive computation problem
by using only triples where the relation is verb-based unlike
the latter, which takes into account “tuple from each pair of
adjacent Noun Phrases”. Moreover, the approach in [77] is very
domain-specific and in their objective of mapping OIE tuples
with a domain-ontology, the authors implicitly assume that
all the facts of an event are inside the same sentence. This assumption,
which is obviously too restrictive, is also found in
ontology population tasks [78,79] and in OIE [63,80,47]. Hence,
it is clear to us that the first task is to be able to chunk a whole
text into a set of events (which are in forms of sentences
that are not necessarily contiguous in a given document [49])
and then to map concepts and relations of a given ontology
or columns of a given database schema into the extracted
pieces of information (from binary or n-ary relations) of each
chunk. We see that unlike [77], many approaches work with
general concepts (named entities categories like person, organization,
location, date, etc.) [76,81]. Some work like YAGO [82] try
to have some specific concepts (e.g “American person”), but it
seems to us too general in comparison to [77] where concepts
such as “NFLTeam”, “GameWinner” or “TeamScoringAll” can be
extracted.
Very few work focus on ontology population in Big Data
context. The main aspect broached is the identification of
the possible class of an entity. More, this identification is
too general, and when it is very domain specific it implies a
significant part of human intervention.

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

4.2.5. ภววิทยาประชากรแยกข้อมูลออก และ ระบุคำเหมือนข้อมูลของเราไม่ต้องใส่ใน computerprocessableแบบฟอร์ม งานปัจจุบันจึงประกอบด้วยในการจัดแยกแบบสอบถามเช่นกรณีแฮontologies, tuples ใน schema ของฐานข้อมูลหรือชุดของ quads(<เรื่อง เพรดิเคต วัตถุ บริบท >) ความคิดนี้อยู่ใน[59-61,40] แต่ใช้นิพจน์ทั่วไปหลายที่เขียนด้วยลายมือเป็นวิธีการที่พบใน [76] ของตาม IE และ ใน [77]ที่พวกเขาเสนอวิธีการเพิ่มผลผลิตจากกระบวนการต้องการโดเมนภววิทยา วิธีการเดิมเลือกที่จะหลบหนีจากปัญหาในการคำนวณราคาโดยเฉพาะเพิ่มความสัมพันธ์ที่ใช้คำกริยาเหมือนหลัง ซึ่งนำเข้าบัญชี "tuple จากแต่ละคู่ติดกับนามวลี" นอกจากนี้ วิธีการใน [77] เป็นอย่างมากเฉพาะของโดเมน และ ในวัตถุที่ประสงค์ของ tuples ต้องแมปกับโดเมนภววิทยา ผู้เขียนนัยว่าข้อเท็จจริงของเหตุการณ์อยู่ในประโยคเดียวกัน อัสสัมชัญนี้ซึ่งเป็นที่เห็นได้ชัดว่าจำกัดเกินไป ว่างานประชากรภววิทยา [78,79] และ [63,80,47] ต้องการ ดังนั้นเป็นที่ชัดเจนกับเราที่งานแรกสามารถก้อนทั้งหมดข้อความลงในชุดกิจกรรม (ซึ่งอยู่ในรูปแบบของประโยคไม่จำเป็นต้องอยู่ติดกันในเอกสารกำหนด [49])แล้วแผนที่แนวคิดและความสัมพันธ์ของภววิทยากำหนดหรือคอลัมน์การกำหนด schema ของฐานข้อมูลเป็นการแยกข้อมูล (จากไบนารี หรือ n เผยแผ่ศาสนาความสัมพันธ์) ของแต่ละก้อน เราเห็นว่า แตกต่างจาก [77], หลายวิธีทำงานกับแนวคิดทั่วไป (ชื่อประเภทตีเช่นบุคคล องค์กรตำแหน่ง วัน ฯลฯ) [76,81] . บางคนทำงานเช่นพยายาม YAGO [82]มีแนวคิดเฉพาะเจาะจงบางอย่าง (เช่น "คนอเมริกัน"), แต่มันดูเหมือนว่าเราเกินไปทั่วไปเทียบ [77] แนวคิดเช่น "NFLTeam", "GameWinner" หรือ "TeamScoringAll" ได้แยกออกมาภววิทยาประชากรข้อมูลเน้นทำงานที่น้อยมากบริบท ในส่วนหลักของ broached คือ รหัสของระดับที่เป็นไปได้ของ เพิ่มเติม รหัสนี้เป็นทั่วไปเกินไป และเมื่อเป็นมากโดเมนเฉพาะ มันถึงส่วนหนึ่งที่สำคัญของมนุษย์

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

4.2.5 ประชากรอภิปรัชญา
เนื่องจากข้อมูลที่ได้รับการสกัดและคำพ้องระบุ
ข้อมูลที่ไม่มีโครงสร้างของเราจะต้องวางใน computerprocessable
รูปแบบ งานปัจจุบันจึงประกอบด้วยในการจัด
อันดับสกัดในรูปแบบการสอบถามเช่นกรณี
ของจีส์, อันดับของคีมาฐานข้อมูลหรือชุดของล่าม
(<เรื่องกริยาวัตถุบริบท>) ความคิดนี้จะพบได้ใน
[59-61,40] แต่ใช้หลายแสดงออกปกติที่เขียนด้วยมือ.
นอกจากนี้ยังพบใน [76] 's On-demand IE วิธีการและใน [77]
ที่พวกเขานำเสนอวิธีการที่จะส่งออก map อเนกประสงค์ จาก
กระบวนการ OIE กับโดเมนอภิปรัชญา วิธีอดีต
เลือกที่จะหนีออกมาจากปัญหาการคำนวณราคาแพง
โดยใช้เพียงอเนกประสงค์ที่มีความสัมพันธ์เป็นคำกริยาที่ใช้แตกต่างจาก
หลังซึ่งจะนำเข้าบัญชี "tuple จากคู่ของแต่ละคน
ที่อยู่ใกล้เคียงคำนามวลี" นอกจากนี้ยังมีวิธีการใน [77] เป็นอย่างมาก
โดเมนที่เฉพาะเจาะจงและวัตถุประสงค์ของพวกเขาในการทำแผนที่ tuples OIE
กับโดเมนอภิปรัชญาเขียนโดยปริยายคิดว่า
ข้อเท็จจริงทั้งหมดของเหตุการณ์อยู่ในประโยคเดียวกัน สมมติฐานนี้
ซึ่งจะเห็นได้ชัดที่เข้มงวดเกินไปยังพบใน
งานประชากรอภิปรัชญา [78,79] และ OIE [63,80,47] ดังนั้น
มันเป็นที่ชัดเจนกับเราว่างานแรกคือการสามารถที่จะรับรู้ทั้ง
ข้อความลงในชุดของเหตุการณ์ที่เกิดขึ้น (ซึ่งอยู่ในรูปแบบของประโยค
ที่ไม่จำเป็นต้องต่อเนื่องกันในเอกสารที่กำหนด [49])
และหลังจากนั้นจะ map แนวคิด และความสัมพันธ์ของอภิปรัชญารับ
หรือคอลัมน์ของคีมาฐานข้อมูลที่ได้รับเข้ามาสกัด
ชิ้นส่วนของข้อมูล (จากฐานความสัมพันธ์หรือ n-Ary) ของแต่ละ
ก้อน เราจะเห็นว่าแตกต่างจาก [77] หลายวิธีทำงานกับ
แนวคิดทั่วไป (ชื่อประเภทกิจการที่เหมือนคนองค์กร
สถานที่วันและอื่น ๆ ) [76,81] การทำงานบางอย่างเช่น Yago [82] พยายาม
ที่จะมีแนวความคิดบางอย่าง (เช่น "คนอเมริกัน") แต่มัน
ดูเหมือนว่าเรากว้างเกินไปเมื่อเทียบกับ [77] ซึ่งแนวคิด
เช่น "NFLTeam", "GameWinner" หรือ "TeamScoringAll" สามารถ ถูก
สกัด.
มุ่งเน้นการทำงานน้อยมากเกี่ยวกับประชากรในอภิปรัชญาข้อมูลขนาดใหญ่
บริบท ด้านหลักทาบทามเป็นบัตรประจำตัวของ
ชั้นที่เป็นไปได้ของกิจการ เพิ่มเติมบัตรประจำตัวนี้จะ
กว้างเกินไปและเมื่อมันเป็นเฉพาะโดเมนมากมันหมายถึง
ส่วนสำคัญของการแทรกแซงของมนุษย์

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

4.2.5 Ontology人口。自信息，已被extracted和synonyms identified在我们的数据在一定unstructured computerprocessable当前的任务包括：thus形式。在organizing在一个形式，如extracted tuples作为查询实例一个数据库的架构，tuples ontologies set（或股四头肌。面向对象；predicate（< context >，，，这是发现在一些想法）。但61,40 ]——[ 59 hand-written several定期使用表达式。这是还发现，在76 . [方法]在On-demand的77 ]和[他们的方法在propose图输出到从三元组。一个世界卫生组织到一个domain-ontology process）的前。从一个到chooses computation问题会非常贵。通过使用三元组的关系，不仅是在verb-based unlike一个帐户，这为“latter takes从每个元组的配对Noun adjacent空间短语”。此外，在[ ]是非常77方法在他们的工程和受domain-specific tuples OIE与一个domain-ontology，这implicitly assume authors所有的事件是一个facts句子内部，这assumption相同。这是明显的，是在restrictive也发现过[和] ontology人口在78,79 tasks，63,80,47 OIE Hence [ ] .这是明确的，这是我们的第一个任务是一个完整的作用是：将一a set of text为forms of events（这是在文章这是不是在一个给定的文件necessarily 49 contiguous [ ]）。然后对concepts和关系图和一个给定的ontology一个给定的数据库架构或列为extracted件的信息（或关系）便于从每个二进制我们看到这样的作用是：将unlike。[工作]，与许多approaches 77一般人喜欢叫concepts categories，实体（组织，位置，日期等）。76,81 ] . [工作]—[ 82 YAGO一些尝试有一些特定的（例如，一个“美国concepts），但它的人。”我们也表明77一般在比较concepts [ ]作为“NFLTeam”，“如不GameWinner”或“TeamScoringAll是。extracted。在一些人口非常关注在工作ontology大数据broached context）是aspect。identification of main一个可能的类的实体，这是更多的identification。这是也很一般，和域特定时它就是一个最小显著部分人介入。

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.