4.1. Identifying relevant pieces of information in messydataAs mention การแปล - 4.1. Identifying relevant pieces of information in messydataAs mention ไทย วิธีการพูด

4.1. Identifying relevant pieces of

4.1. Identifying relevant pieces of information in messy
data
As mentioned in the challenges list, this task can be done before
the disambiguation pile. In this case, we must prune irrelevant
data. This pruning is mostly done by a “bag of words”
approach. It helps through cosine similarity to rapidly compare
things (documents in [48] and sentences in [49, chap. 5]) and
to select relevant one, according to a threshold. If done after
the pile, this task can be seen as the build of a Big Data index.
Obviously, this problem is mainly broached by people who intend
to design a search engine. Therefore, we have in [38] a
built of an inverted index, for fast keyword-search answering,
where a Lucene document is output for each entity and a
structured index to easily retrieve pieces of information about
a given entity. Likewise, but on RDF databases, [50] use B + −
Trees to index object identifiers of RDF nodes and also use an
inverted index to improve keyword queries. Unlike previous
cited authors, [51] for Querying Distributed RDF Repositories
purposes, built indices on “schema paths” (concepts whose
instances have to be joined to answer a given query) to identify
the sources which may contain the information needed.
0/5000
จาก: -
เป็น: -
ผลลัพธ์ (ไทย) 1: [สำเนา]
คัดลอก!
4.1. การระบุข้อมูลในยุ่งเกี่ยวชิ้นข้อมูลดังกล่าวในรายการท้าทาย งานนี้สามารถทำได้ก่อนกองภาพยนตร์ ในกรณีนี้ เราต้องถอนไม่เกี่ยวข้องข้อมูล ตัดนี้เป็นส่วนใหญ่โดยมี "ถุงคำ"แนวทางการ ช่วยผ่านโคไซน์คล้ายเปรียบเทียบอย่างรวดเร็วสิ่ง (เอกสาร [48] และประโยคใน [49, chap. 5]) และเลือกหนึ่งที่เกี่ยวข้อง ตามเกณฑ์การ ถ้าหลังขนสั้น เห็นงานนี้ได้เป็นการสร้างดัชนีข้อมูลขนาดใหญ่ได้เห็นได้ชัด ปัญหานี้ส่วนใหญ่ broached คนที่ตั้งใจการออกแบบเครื่องมือค้นหา ดังนั้น เรามีใน [38] เป็นสร้างดัชนีคว่ำ สำหรับการค้นหาคำสำคัญรวดเร็วตอบผลลัพธ์สำหรับแต่ละเอนทิตีเอกสาร Lucene และโครงสร้างดัชนีสามารถเรียกข้อมูลเกี่ยวกับเอนทิตีที่กำหนด ในทำนองเดียวกัน แต่ ในฐาน ข้อมูล RDF, [50] ใช้ B + −ต้นไม้ตัวระบุวัตถุของโหน RDF และยัง ใช้เป็นกลับการปรับปรุงคำถาม ซึ่งแตกต่างจากก่อนหน้านี้อ้างถึงผู้เขียน, [51] สำหรับสอบถาม RDF กระจายการเก็บข้อมูลวัตถุประสงค์ สร้างดัชนีบน "เส้นทางแบบแผน" (แนวคิดที่มีกรณีต้องการจะเข้าร่วมตอบแบบสอบถามที่กำหนด) เพื่อระบุแหล่งมาซึ่งอาจประกอบด้วยข้อมูลที่จำเป็น
การแปล กรุณารอสักครู่..
ผลลัพธ์ (ไทย) 2:[สำเนา]
คัดลอก!
4.1 การระบุชิ้นส่วนที่เกี่ยวข้องของข้อมูลในยุ่ง
ข้อมูล
ตามที่ระบุไว้ในรายการความท้าทายงานนี้สามารถทำได้ก่อนที่
กองแก้ความกำกวม ในกรณีนี้เราจะต้องตัดไม่เกี่ยวข้อง
ข้อมูล การตัดแต่งกิ่งนี้จะกระทำโดยส่วนใหญ่เป็น "ถุงคำว่า"
วิธีการ มันจะช่วยให้ผ่านโคไซน์ความคล้ายคลึงกันอย่างรวดเร็วเปรียบเทียบ
สิ่ง (เอกสารใน [48] และประโยคใน [49, CHAP. 5]) และ
เลือกหนึ่งที่เกี่ยวข้องตามเกณฑ์ หากทำหลังจากที่
กองงานนี้สามารถมองเห็นเป็นโครงสร้างของดัชนีข้อมูลขนาดใหญ่.
เห็นได้ชัดว่าปัญหานี้จะทาบทามโดยส่วนใหญ่คนที่ตั้งใจ
ในการออกแบบเครื่องมือค้นหา ดังนั้นการที่เรามีใน [38] เป็น
ที่สร้างขึ้นจากดัชนีคว่ำสำหรับการตอบคำหลักที่ค้นหาได้อย่างรวดเร็วและ
ที่เอกสาร Lucene คือผลลัพธ์สำหรับแต่ละกิจการและ
ดัชนีที่มีโครงสร้างเพื่อให้ง่ายต่อการดึงชิ้นส่วนของข้อมูลเกี่ยวกับ
กิจการที่ได้รับ ในทำนองเดียวกัน แต่ในฐานข้อมูล RDF [50] ใช้ B + -
ต้นไม้เพื่อตัวระบุดัชนีวัตถุของโหนด RDF และยังใช้
ดัชนีคว่ำในการปรับปรุงคำสั่งคำหลัก ซึ่งแตกต่างจากก่อนหน้านี้
ผู้เขียนอ้างถึง [51] สำหรับการสอบถามกระจาย RDF Repositories
วัตถุประสงค์ดัชนีที่สร้างขึ้นบน "เส้นทางสคี" (แนวคิดที่มี
กรณีจะต้องมีการเข้าร่วมในการตอบแบบสอบถามที่กำหนด) เพื่อระบุ
แหล่งที่มาซึ่งอาจจะมีข้อมูลที่จำเป็น
การแปล กรุณารอสักครู่..
 
ภาษาอื่น ๆ
การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.

Copyright ©2024 I Love Translation. All reserved.

E-mail: