Entity consolidation can be seen as the building of owl:sameAs closure in OWL-data. In practice this is not always straight. In fact, owl:sameAs property is not always explicit. It can be hidden behind inference on an inverse functional property [83], a functional property [21], an equivalent property [84], cardinality restrictions [38,39]. Moreover, an equivalent property can be derived through heuristics (string similarity between properties’ short names or labels). Concerning algorithms, [83,21] have similar approaches: to group all equivalent entities in a given set and to assign a unique identifier to them, which will replace entities of its set within real data. To achieve this goal, [83] propose a method which can be run many times due to new derivations implied by an inverse functional property! To obviate these limitations, [21] leverage on their ordering of
rules and MapReduce parallel capabilities.
รวมเอนทิตีสามารถมองเห็นเป็นอาคารของนกฮูก: sameAs ปิดข้อมูลนกฮูก ในทางปฏิบัติ ไม่เสมอตรงนี้ ในความเป็นจริง นกฮูก: sameAs คุณสมบัติเสมอไม่ชัดเจน มันสามารถซ่อนอยู่เบื้องหลังข้อบนการผกผันทำงานคุณสมบัติ [83], คุณสมบัติทำงาน [21], โดยมีคุณสมบัติเทียบเท่า [84], จำกัดจำนวนนับ [38,39] นอกจากนี้ มีคุณสมบัติเทียบเท่าสามารถได้รับผ่านการรุก (สายอักขระความคล้ายกันระหว่างคุณสมบัติชื่อย่อหรือป้ายชื่อ) เกี่ยวข้องกับอัลกอริทึม, [83,21] มีวิธีการคล้ายกัน: การจัดกลุ่มหน่วยงานเทียบเท่าทั้งหมดในชุดที่กำหนด และ การกำหนดรหัสเฉพาะให้พวกเขา ซึ่งจะแทนเอนทิตีของการตั้งค่าภายในข้อมูลจริง เพื่อให้บรรลุเป้าหมายนี้, [83] เสนอวิธีการที่สามารถเรียกใช้หลายครั้งเนื่องจากรากศัพท์ใหม่โดยนัย โดยคุณสมบัติการทำงานผกผัน การ obviate ข้อจำกัดเหล่านี้ เลเวอเรจ [21] ในการสั่งซื้อของกฎและความสามารถขนาน MapReduce
การแปล กรุณารอสักครู่..
การรวมกิจการสามารถมองเห็นเป็นตึกของนกฮูก : sameas ปิดข้อมูลนกฮูก ในการปฏิบัตินี้มักจะไม่ตรง ในความเป็นจริง , นกฮูก : sameas คุณสมบัติไม่ได้เสมอที่ชัดเจน มันสามารถซ่อนอยู่เบื้องหลังการอนุมานในตรงกันข้ามคุณสมบัติการทำงาน [ 83 ] คุณสมบัติการทำงาน [ 21 ] , [ คุณสมบัติเทียบเท่า 84 ] , [ 38,39 ภาวะเชิงการนับ จำกัด ] นอกจากนี้ คุณสมบัติเทียบเท่า สามารถจะได้มาผ่านวิธีฮิวริสติก ( สายสั้นหรือความคล้ายคลึงกันระหว่างคุณสมบัติชื่อป้าย ) เกี่ยวกับขั้นตอนวิธี [ 83,21 ] มีวิธีการที่คล้ายกัน : กลุ่มหน่วยงานเทียบเท่าทั้งหมดที่ระบุในการตั้งค่าและกำหนดให้ระบุที่ไม่ซ้ำกันเหล่านั้น ซึ่งจะมาแทนที่การตั้งค่าภายในของหน่วยงาน ข้อมูลที่แท้จริง เพื่อให้บรรลุเป้าหมายนี้ [ 83 ] ขอวิธีที่สามารถเรียกใช้หลายครั้งเนื่องจากคุณสมบัติการทำงานใหม่โดยการหาโดยนัยตรงกันข้าม ! เพื่อป้องกันข้อ จำกัด เหล่านี้ , [ 21 ] ต่อรองในการสั่งซื้อของกฎและ mapreduce ความสามารถขนาน
การแปล กรุณารอสักครู่..