4.2.1. Named entity resolution (NER)Usually, NER is a task well resolv การแปล - 4.2.1. Named entity resolution (NER)Usually, NER is a task well resolv ไทย วิธีการพูด

4.2.1. Named entity resolution (NER

4.2.1. Named entity resolution (NER)
Usually, NER is a task well resolved by existing tools. But with
advent of social media like Facebook and particularly Twitter,
the writing style has deeply changed and new techniques
have to be developed. It is the case of [45,52,53] which tackle
NER in tweets. These basic tools are actually used to solve
more complex problems like event extraction in tweets [46].
Since tweets are short, very informal and noisy (username
mentions, URLs, various markers (@, #)) some changes have
to be done to improve classic NLP tools like Stanford NER or
Open NLP. [52,45,53] share the opinion that supervised learning
gives good results and that learning corpus must be made
up with tweets. To improve NER, gazetteers [52] or entities
repositories like Freebase [45] have to be extended (many new
entities are missing there e.g: “Nintendo DS lite” (a product),
“Blue Stone 42” (a tv-show), etc.). Moreover, variations of
words have to be clustered and normalized (e.g: “tomorrow”
can be written ‘2mr’, ‘2mro’, ‘2mrrw’, ‘2mrw’, . . . ) [45,53,54] and
we must know if we can learn something about capitalization
of words (which is randomly done in tweets universe) in
a given tweet [45].
4.2.2. Coreference resolution
Coreference resolution is the task of finding all expressions
that refer to the same entity in a discourse [55]. In this domain,
improvements are not related to Big Data features and
are mainly focused on enrichment and precision of new lexical
and syntactic features and global inference [56,55,57].
Haghighi and Klein [56] introduce new syntactic, semantic
features and discourse phenomena to improve existing
systems. Their work has been completed by additional features
(e.g: Denonym, Word inclusion in [57], Speaker identification
in [55], Web features like General co-occurrence, Hearst
co-occurrence, Entity-based context, Pronoun context in [58], etc.).
Most models for this task determine if two mentions refer to
each other using a single function over a set of constraints
or features, but some recent approaches tend to use multitiers
methods where mentions are disambiguated gradually
in well-ordered tiers which apply each, a specific function
[55,57]. It is obvious that in a Big Data supply chain, such approaches
can be difficultly used without modification. Indeed,
analyzing billions of documents more than seven times is not
realistic. We note that (the direct) approach of [58] (direct) is
more scalable, but it is a pairwise disambiguation method.
0/5000
จาก: -
เป็น: -
ผลลัพธ์ (ไทย) 1: [สำเนา]
คัดลอก!
4.2.1 มีชื่อเอนทิตีละเอียด (อีกฝ่าย)มักจะ อีกฝ่ายเป็นงานดีแก้ไขได้ โดยเครื่องมือที่มีอยู่ แต่มีจุติของสื่อสังคมเช่น Facebook และ Twitter โดยเฉพาะลักษณะการเขียนมีเทคนิคใหม่ และเปลี่ยนแปลงอย่างลึกซึ้งมีการพัฒนา เป็นกรณีของ [45,52,53] ที่ต่อสู้อีกฝ่ายในทวี เครื่องมือพื้นฐานเหล่านี้จริงใช้ในการแก้ปัญหาปัญหาที่ซับซ้อนมากขึ้นเช่นเหตุการณ์สกัดในทวี [46]ตั้งแต่ทวีมีสั้น ไม่เป็นทางการ และเสียงดัง (ชื่อผู้ใช้กล่าวถึง Url เครื่องหมายต่าง ๆ (แอท #)) มีการเปลี่ยนแปลงบางอย่างต้องทำการปรับปรุงเครื่องมือ NLP คลาสสิกเช่นสแตนฟอร์ดอีกฝ่าย หรือเปิด NLP แชร์ [52,45,53] ความคิดเห็นที่ดูแลการเรียนรู้ให้ผลลัพธ์ที่ดีและที่สถานีการเรียนรู้ต้องทำเรื่องทวี การปรับปรุงอีกฝ่าย gazetteers [52] หรือเอนทิตีต้องขยายมากใหม่เก็บเช่น Freebase [45]เอนทิตีขาดหายไปเช่นมี: "นินเทนโด DS ไลท์" (ผลิตภัณฑ์),"ฟ้าหิน 42" (-ทีวี), ฯลฯ .) นอกจากนี้ รูปแบบของคำมีการคลัสเตอร์ และตามปกติ (เช่น: "พรุ่งนี้"สามารถเขียน '2mr', '2mro', '2mrrw', '2mrw',...) [45,53,54] และเราต้องรู้ว่า เราสามารถเรียนรู้บางสิ่งเกี่ยวกับตัวพิมพ์ใหญ่คำ (ซึ่งได้ทำในจักรวาลทวี) ในการทวีการกำหนด [45]4.2.2 coreference ละเอียดความละเอียด coreference มีภารกิจค้นหานิพจน์ทั้งหมดที่อ้างอิงถึงเอนทิตีเดียวในวาทกรรม [55] ในโดเมนนี้การปรับปรุงไม่เกี่ยวข้องกับข้อมูลคุณสมบัติ และส่วนใหญ่เน้นในการเพิ่มคุณค่าและความแม่นยำของใหม่จากคำใกล้เคียงและคุณสมบัติทางไวยากรณ์และข้อโลก [56,55,57]Haghighi และ Klein [56] แนะนำใหม่ทางไวยากรณ์ ความหมายคุณลักษณะและปรากฏการณ์วาทกรรมในการปรับปรุงที่มีอยู่ระบบ งานเสร็จสมบูรณ์ โดยคุณลักษณะเพิ่มเติม(เช่น: Denonym [57] โหวต Word รหัสลำโพงใน [55], เว็บสิ่งทั่วไปเกิดร่วม เฮิสต์เฮเกิดร่วม บริบทใช้เอนทิตี บริบทสรรพนาม [58] ฯลฯ)ตรวจสอบรุ่นใหญ่สำหรับงานนี้ถ้ากล่าวถึงสองถึงกันโดยใช้ฟังก์ชันเดียวผ่านชุดข้อจำกัดหรือสิ่งอำนวยความสะดวก แต่บางวิธีล่ามักจะ ใช้ multitiersวิธีการที่กล่าวถึงมี disambiguated ค่อย ๆในระดับดีสั่งที่ใช้งานเฉพาะแต่ละ[55,57] . มันเป็นที่ชัดเจนว่า ในข้อมูลใหญ่ห่วงโซ่อุปทาน วิธีดังกล่าวdifficultly ใช้ไม่ แน่นอนวิเคราะห์เอกสารมากกว่าเจ็ดครั้งไม่เป็นพันจริง เราทราบว่า (สายตรง) เป็นวิธีการของ [58] (สายตรง)เพิ่มขนาด แต่มันเป็นวิธีการแก้ความกำกวมแพร์ไวส์
การแปล กรุณารอสักครู่..
ผลลัพธ์ (ไทย) 2:[สำเนา]
คัดลอก!
4.2.1 ความละเอียดของนิติบุคคลที่มีชื่อ (NER)
โดยปกติ NER เป็นงานที่ได้รับการแก้ไขอย่างดีจากเครื่องมือที่มีอยู่ แต่ด้วย
การถือกำเนิดของสื่อสังคมออนไลน์เช่น Facebook และโดยเฉพาะอย่างยิ่ง Twitter,
สไตล์การเขียนที่มีการเปลี่ยนแปลงอย่างลึกซึ้งและเทคนิคใหม่ ๆ
จะต้องมีการพัฒนา มันเป็นกรณีของ [45,52,53] ซึ่งแก้ไขปัญหา
NER ในทวิตเตอร์ เครื่องมือพื้นฐานเหล่านี้จะถูกนำมาใช้จริงในการแก้
ปัญหาที่ซับซ้อนมากขึ้นเช่นการสกัดเหตุการณ์ในทวีต [46].
ตั้งแต่ทวีตสั้นทางการมากและมีเสียงดัง (ชื่อผู้ใช้
กล่าวถึง URL ที่เครื่องหมายต่างๆ (@, #)) การเปลี่ยนแปลงบางอย่างได้
ที่จะทำเพื่อ ปรับปรุงเครื่องมือ NLP คลาสสิกเช่นสแตนฟอ NER หรือ
เปิด NLP [52,45,53] แบ่งปันความเห็นว่าการเรียนรู้ภายใต้การดูแล
ให้ผลดีและคลังข้อมูลการเรียนรู้จะต้องทำ
ขึ้นมาพร้อมกับทวีต เพื่อปรับปรุงเนอร์ Gazetteers [52] หรือหน่วยงาน
ที่เก็บเช่น Freebase [45] จะต้องมีการขยาย (ใหม่หลาย
หน่วยงานที่มีการขาดหายไปเช่น: "Nintendo DS Lite" (ผลิตภัณฑ์)
"ฟ้าหิน 42" (ทีวีโชว์) ฯลฯ ) นอกจากนี้รูปแบบของ
คำพูดจะต้องมีการกระจุกตัวและปกติ (เช่น: "วันพรุ่งนี้"
สามารถเขียนได้ '2MR', '2mro', '2mrrw', '2mrw'...) [45,53,54] และ
เราจะต้อง รู้ว่าถ้าเราสามารถเรียนรู้อะไรเกี่ยวกับโครงสร้างเงินทุน
ของคำ (ซึ่งจะทำแบบสุ่มในทวิตเตอร์จักรวาล) ใน
ทวีตรับ [45].
4.2.2 Coreference ความละเอียด
ความละเอียด Coreference เป็นงานในการหาการแสดงออกทั้งหมด
ที่อ้างถึงนิติบุคคลเดียวกันในวาทกรรม [55] ในโดเมนนี้
การปรับปรุงไม่เกี่ยวข้องกับคุณลักษณะของข้อมูลขนาดใหญ่และ
มีการมุ่งเน้นในการเพิ่มปริมาณและความแม่นยำของคำศัพท์ใหม่
คุณสมบัติและประโยคและการอนุมานโลก [56,55,57].
Haghighi และ Klein [56] แนะนำประโยค, ความหมายใหม่
คุณสมบัติและ ปรากฏการณ์วาทกรรมที่มีอยู่ในการปรับปรุง
ระบบ งานของพวกเขาได้รับการเสร็จสมบูรณ์โดยคุณลักษณะเพิ่มเติม
(เช่น Denonym รวม Word ในการ [57], บัตรประจำตัวลำโพง
ใน [55] คุณสมบัติเว็บเช่นทั่วไปร่วมเกิดเฮิร์สต์
บริบทร่วมการเกิด Entity ตามบริบทสรรพนามใน [58 ] ฯลฯ ).
แบบส่วนใหญ่สำหรับงานนี้ตรวจสอบว่าทั้งสองกล่าวอ้างถึง
กันโดยใช้ฟังก์ชั่นเดียวมากกว่าชุดของข้อ จำกัด
หรือคุณลักษณะ แต่บางวิธีการที่ผ่านมามักจะใช้ multitiers
วิธีการที่กล่าวถึงจะค่อยๆ disambiguated
ในชั้นเดียวกับที่สั่งซื้อ ซึ่งใช้แต่ละฟังก์ชั่นที่เฉพาะเจาะจง
[55,57] เป็นที่ชัดเจนว่าในห่วงโซ่อุปทานข้อมูลขนาดใหญ่วิธีการดังกล่าว
สามารถนำมาใช้โดยไม่มีการดัดแปลงกุกกัก อันที่จริง
การวิเคราะห์พันล้านของเอกสารมากกว่าเจ็ดครั้งไม่ได้
มีเหตุผล เราทราบว่า (โดยตรง) วิธีการของ [58] (โดยตรง) คือ
สามารถปรับขนาดได้มากขึ้น แต่มันเป็นวิธีการแก้ความกำกวมคู่
การแปล กรุณารอสักครู่..
 
ภาษาอื่น ๆ
การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.

Copyright ©2024 I Love Translation. All reserved.

E-mail: