The task of the document statistics

The task of the document statistics component is simply to gather and record
statistical information about words, features, and documents. This information
is used by the ranking component to compute scores for documents. The types
of data generally required are the counts of index term occurrences (both words
and more complex features) in individual documents, the positions in the documents
where the index terms occurred, the counts of occurrences over groups
of documents (such as all documents labeled “sports” or the entire collection of
documents), and the lengths of documents in terms of the number of tokens. The
actual data required is determined by the retrieval model and associated ranking
algorithm. The document statistics are stored in lookup tables, which are data
structures designed for fast retrieval.

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

งานของคอมโพเนนต์สถิติเอกสารเป็นเพียงการ รวบรวม และบันทึกข้อมูลทางสถิติเกี่ยวกับคำ คุณลักษณะ และเอกสาร ข้อมูลนี้ถูกใช้ โดยคอมโพเนนต์การจัดอันดับเพื่อคำนวณคะแนนสำหรับเอกสาร ชนิดข้อมูลที่จำเป็นโดยทั่วไปจะนับจำนวนของดัชนีคำเกิด (ทั้งสองคำและซับซ้อนมากขึ้นในแต่ละเอกสาร ตำแหน่งในเอกสารที่คำดัชนีเกิดขึ้น การตรวจนับของเหตุการณ์กลุ่มเอกสาร (เช่นระบุว่า "กีฬา" เอกสารทั้งหมดหรือทั้งเอกสาร), และความยาวของเอกสารในแง่ของจำนวนของสัญญาณ การข้อมูลจริงที่จำเป็นจะถูกกำหนด โดยรูปแบบเรียก และอันดับที่เกี่ยวข้องอัลกอริทึม สถิติเอกสารถูกเก็บในตารางการค้นหา ซึ่งเป็นข้อมูลโครงสร้างที่ออกแบบมาสำหรับการดึงอย่างรวดเร็ว

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

งานของส่วนประกอบสถิติเอกสารเป็นเพียงการรวบรวมและบันทึก
ข้อมูลสถิติเกี่ยวกับคำพูดของคุณสมบัติและเอกสาร ข้อมูลเหล่านี้
จะถูกใช้โดยองค์ประกอบในการคำนวณการจัดอันดับคะแนนสำหรับเอกสาร ประเภท
ของข้อมูลที่ต้องการโดยทั่วไปจะมีค่าเกิดขึ้นคำดัชนี (ทั้งคำพูด
และคุณสมบัติที่ซับซ้อนมากขึ้น) ในเอกสารแต่ละตำแหน่งในเอกสาร
ที่คำดัชนีที่เกิดขึ้นนับจากเหตุการณ์ที่เกิดขึ้นในช่วงที่กลุ่ม
ของเอกสาร (เช่นเอกสารทั้งหมดที่มีป้ายกำกับ "กีฬา" หรือการเก็บรวบรวมทั้งหมดของ
เอกสาร) และความยาวของเอกสารในแง่ของจำนวนราชสกุล
ข้อมูลจริงต้องถูกกำหนดโดยรูปแบบการดึงและการเชื่อมโยงการจัดอันดับของ
อัลกอริทึม สถิติเอกสารถูกเก็บไว้ในตารางการค้นหาซึ่งเป็นข้อมูล
โครงสร้างออกแบบมาสำหรับการเรียกใช้อย่างรวดเร็ว

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

งานสถิติเอกสารประกอบเป็นเพียงการรวบรวมและบันทึกข้อมูลสถิติเกี่ยวกับคำ คุณสมบัติ และเอกสาร ข้อมูลนี้ใช้เป็นส่วนประกอบการจัดอันดับคำนวณคะแนนสำหรับเอกสาร ประเภทข้อมูลโดยทั่วไปจะต้องมีการนับของคำดัชนี ( ทั้งสองคำเกิดและคุณลักษณะที่ซับซ้อนมากขึ้น ) ในเอกสารแต่ละตำแหน่งในเอกสารที่ดัชนีเงื่อนไขเกิดขึ้น นับจากเหตุการณ์เหนือกลุ่มของเอกสาร ( เช่นเอกสารที่ระบุว่า " กีฬา " หรือทั้งคอลเลกชันของเอกสาร ) และความยาวของเอกสาร ในแง่ของจำนวนของสัญญาณ ที่จริง ข้อมูลต้องถูกกำหนดโดยการดึงรูปแบบและที่เกี่ยวข้องการจัดอันดับขั้นตอนวิธี เอกสารสถิติจะถูกเก็บไว้ในตารางข้อมูล ซึ่งเป็นข้อมูลโครงสร้างที่ออกแบบมาเพื่อกู้คืนอย่างรวดเร็ว

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.