4.2.2. Coreference resolutionCorefe

4.2.2. Coreference resolution
Coreference resolution is the task of finding all expressions
that refer to the same entity in a discourse [55]. In this domain,
improvements are not related to Big Data features and
are mainly focused on enrichment and precision of new lexical
and syntactic features and global inference [56,55,57].
Haghighi and Klein [56] introduce new syntactic, semantic
features and discourse phenomena to improve existing
systems. Their work has been completed by additional features
(e.g: Denonym, Word inclusion in [57], Speaker identification
in [55], Web features like General co-occurrence, Hearst
co-occurrence, Entity-based context, Pronoun context in [58], etc.).
Most models for this task determine if two mentions refer to
each other using a single function over a set of constraints
or features, but some recent approaches tend to use multitiers
methods where mentions are disambiguated gradually
in well-ordered tiers which apply each, a specific function
[55,57]. It is obvious that in a Big Data supply chain, such approaches
can be difficultly used without modification. Indeed,
analyzing billions of documents more than seven times is not
realistic. We note that (the direct) approach of [58] (direct) is
more scalable, but it is a pairwise disambiguation method.
Once more, we note that very few work have in mind Big
Data characteristics while addressing coreference resolution.
In challenges about indexing billions of RDF triples or reasoning
on them (see further), we see that scientists deal
with data formats which are quite easy to handle by a
computer (RDF/RDFS, OWL/OWL2). But the transformation
of pieces of natural language-written texts into computerunderstandable
formats have to be done first.

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

4.2.2 coreference ละเอียดความละเอียด coreference มีภารกิจค้นหานิพจน์ทั้งหมดที่อ้างอิงถึงเอนทิตีเดียวในวาทกรรม [55] ในโดเมนนี้การปรับปรุงไม่เกี่ยวข้องกับข้อมูลคุณสมบัติ และส่วนใหญ่เน้นในการเพิ่มคุณค่าและความแม่นยำของใหม่จากคำใกล้เคียงและคุณสมบัติทางไวยากรณ์และข้อโลก [56,55,57]Haghighi และ Klein [56] แนะนำใหม่ทางไวยากรณ์ ความหมายคุณลักษณะและปรากฏการณ์วาทกรรมในการปรับปรุงที่มีอยู่ระบบ งานเสร็จสมบูรณ์ โดยคุณลักษณะเพิ่มเติม(เช่น: Denonym [57] โหวต Word รหัสลำโพงใน [55], เว็บสิ่งทั่วไปเกิดร่วม เฮิสต์เฮเกิดร่วม บริบทใช้เอนทิตี บริบทสรรพนาม [58] ฯลฯ)ตรวจสอบรุ่นใหญ่สำหรับงานนี้ถ้ากล่าวถึงสองถึงกันโดยใช้ฟังก์ชันเดียวผ่านชุดข้อจำกัดหรือสิ่งอำนวยความสะดวก แต่บางวิธีล่ามักจะ ใช้ multitiersวิธีการที่กล่าวถึงมี disambiguated ค่อย ๆในระดับดีสั่งที่ใช้งานเฉพาะแต่ละ[55,57] . มันเป็นที่ชัดเจนว่า ในข้อมูลใหญ่ห่วงโซ่อุปทาน วิธีดังกล่าวdifficultly ใช้ไม่ แน่นอนวิเคราะห์เอกสารมากกว่าเจ็ดครั้งไม่เป็นพันจริง เราทราบว่า (สายตรง) เป็นวิธีการของ [58] (สายตรง)เพิ่มขนาด แต่มันเป็นวิธีการแก้ความกำกวมแพร์ไวส์เมื่อเราทราบเพิ่มเติม ทำงานที่น้อยมากมีใจใหญ่ลักษณะข้อมูลในขณะที่จัดการกับ coreference ความละเอียดในความท้าทายเกี่ยวกับดัชนีพัน RDF triples หรือเหตุผลพวกเขา (ดูเพิ่มเติม), เราได้เห็นว่า นักวิทยาศาสตร์จัดการด้วยรูปแบบของข้อมูลซึ่งจะค่อนข้างง่ายโดยการคอมพิวเตอร์ (RDF/RDFS นก ฮูก/OWL2) แต่การเปลี่ยนแปลงของภาษาธรรมชาติเขียนข้อความลงใน computerunderstandableรูปแบบที่ต้องทำก่อน

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

4.2.2 Coreference ความละเอียด
ความละเอียด Coreference เป็นงานในการหาการแสดงออกทั้งหมด
ที่อ้างถึงนิติบุคคลเดียวกันในวาทกรรม [55] ในโดเมนนี้
การปรับปรุงไม่เกี่ยวข้องกับคุณลักษณะของข้อมูลขนาดใหญ่และ
มีการมุ่งเน้นในการเพิ่มปริมาณและความแม่นยำของคำศัพท์ใหม่
คุณสมบัติและประโยคและการอนุมานโลก [56,55,57].
Haghighi และ Klein [56] แนะนำประโยค, ความหมายใหม่
คุณสมบัติและ ปรากฏการณ์วาทกรรมที่มีอยู่ในการปรับปรุง
ระบบ งานของพวกเขาได้รับการเสร็จสมบูรณ์โดยคุณลักษณะเพิ่มเติม
(เช่น Denonym รวม Word ในการ [57], บัตรประจำตัวลำโพง
ใน [55] คุณสมบัติเว็บเช่นทั่วไปร่วมเกิดเฮิร์สต์
บริบทร่วมการเกิด Entity ตามบริบทสรรพนามใน [58 ] ฯลฯ ).
แบบส่วนใหญ่สำหรับงานนี้ตรวจสอบว่าทั้งสองกล่าวอ้างถึง
กันโดยใช้ฟังก์ชั่นเดียวมากกว่าชุดของข้อ จำกัด
หรือคุณลักษณะ แต่บางวิธีการที่ผ่านมามักจะใช้ multitiers
วิธีการที่กล่าวถึงจะค่อยๆ disambiguated
ในชั้นเดียวกับที่สั่งซื้อ ซึ่งใช้แต่ละฟังก์ชั่นที่เฉพาะเจาะจง
[55,57] เป็นที่ชัดเจนว่าในห่วงโซ่อุปทานข้อมูลขนาดใหญ่วิธีการดังกล่าว
สามารถนำมาใช้โดยไม่มีการดัดแปลงกุกกัก อันที่จริง
การวิเคราะห์พันล้านของเอกสารมากกว่าเจ็ดครั้งไม่ได้
มีเหตุผล เราทราบว่า (โดยตรง) วิธีการของ [58] (โดยตรง) คือ
สามารถปรับขนาดได้มากขึ้น แต่มันเป็นวิธีการแก้ความกำกวมคู่.
อีกครั้งที่เราทราบว่าการทำงานน้อยมากที่มีในใจบิ๊ก
ลักษณะข้อมูลในขณะที่ความละเอียด coreference.
ในความท้าทายเกี่ยวกับ จัดทำดัชนีพันล้านอเนกประสงค์ RDF หรือเหตุผล
ที่พวกเขา (ดูเพิ่มเติม) เราจะเห็นว่านักวิทยาศาสตร์จัดการ
กับรูปแบบข้อมูลที่ค่อนข้างง่ายต่อการจัดการโดย
คอมพิวเตอร์ (RDF / RDFS นกฮูก / OWL2) แต่การเปลี่ยนแปลง
ของชิ้นส่วนของภาษาเขียนตำราธรรมชาติเข้า computerunderstandable
รูปแบบจะต้องมีการทำครั้งแรก

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

4.2.2 . coreference ละเอียดcoreference การแก้ปัญหาคือการหาทุกสำนวนที่อ้างถึงองค์กรเดียวกันในวาทกรรม [ 55 ] ในโดเมนนี้การปรับปรุงที่ไม่ได้เกี่ยวข้องกับคุณสมบัติของข้อมูลใหญ่ส่วนใหญ่จะเน้นไปที่การเสริมและความแม่นยำของศัพท์ใหม่และคุณสมบัติทางวากยสัมพันธ์และการ 56,55,57 [ สากล ]และ haghighi ไคลน์ [ 56 ] แนะนำใหม่ไวยากรณ์ ความหมายคุณสมบัติและปรากฏการณ์วาทกรรมเพื่อปรับปรุงที่มีอยู่ระบบ งานของพวกเขาได้เสร็จสมบูรณ์แล้ว โดยคุณสมบัติเพิ่มเติม( เช่น : denonym , รวมคำพูด [ 57 ] ระบุผู้พูดใน [ 55 ] เว็บ คุณสมบัติเช่นการทั่วไป , เฮสต์การใช้สรรพนามบุคคล , บริบท , บริบท [ 58 ] , ฯลฯ )แบบที่สุดสำหรับงานนี้ ระบุว่า หากสองเอ่ยอ้างถึงแต่ละอื่น ๆโดยใช้ฟังก์ชันเดียวผ่านชุดของข้อ จำกัดหรือคุณสมบัติ แต่บางวิธีล่าสุดมักจะใช้ multitiersวิธีการที่กล่าวถึงเป็น disambiguated ค่อย ๆในการสั่งแบบที่ใช้ในแต่ละฟังก์ชั่นที่เฉพาะเจาะจง[ 55,57 ] มันเป็นที่ชัดเจนว่าในโซ่อุปทานข้อมูลใหญ่ วิธีการดังกล่าวสามารถที่ยากมาใช้โดยไม่ดัดแปลง แน่นอนวิเคราะห์พันล้านของเอกสารมากกว่าเจ็ดครั้งไม่ได้ที่สมจริง เราทราบว่า ( โดยตรง ) วิธีการของ [ 58 ] ( โดยตรง )ยืดหยุ่นมากขึ้น แต่มันเป็นวิธีแก้ความกำกวมคู่ .อีกครั้งที่เราทราบว่าน้อยมากที่งานมีจิตใจใหญ่ข้อมูลลักษณะขณะที่อยู่ coreference ความละเอียดในความท้าทายเกี่ยวกับการพันล้านของอเนกประสงค์ RDF หรือเหตุผลพวกเขา ( ดูเพิ่มเติม ) เราเห็นว่านักวิทยาศาสตร์จัดการกับรูปแบบข้อมูลที่ค่อนข้างง่ายที่จะจัดการโดยคอมพิวเตอร์ ( RDF / rdfs , นกฮูก / owl2 ) แต่การเปลี่ยนแปลงชิ้นที่เขียนข้อความลงใน computerunderstandable ภาษาธรรมชาติรูปแบบมีให้เรียบร้อยก่อน

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.