One of the most common types used i

One of the most common types used in older retrieval models is known as tf.idf
weighting. There are many variations of these weights, but they are all based on a
combination of the frequency or count of index term occurrences in a document
(the term frequency, or tf ) and the frequency of index term occurrence over the
entire collection of documents (inverse document frequency, or idf ). The idf weight
is called inverse document frequency because it gives high weights to terms that
occur in very few documents. A typical formula for idf is logN/n, whereN is the total number of documents indexed by the search engine and n is the number of
documents that contain a particular term.

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

ชนิดทั่วไปที่ใช้ในรุ่นเก่าเรียกอย่างใดอย่างหนึ่งเรียกว่า tf.idfน้ำหนัก มีหลายรูปแบบของตุ้มน้ำหนักเหล่านี้ แต่พวกเขาตามรวมกันของความถี่หรือจำนวนของเหตุการณ์คำดัชนีในเอกสาร(ความถี่ระยะ หรือ tf) และความถี่ของการเกิดระยะดัชนีผ่านการคอลเลกชันทั้งหมดของเอกสาร (เอกสารผกผันความถี่ หรือ idf) น้ำหนัก idfเรียกว่าความถี่เอกสารผกผัน เพราะจะให้น้ำหนักสูงถึงเงื่อนไขที่เกิดขึ้นในเอกสารที่น้อยมาก สูตรทั่วไปสำหรับ idf คือ logN/n, whereN คือ จำนวนรวมของเอกสาร โดยค้นหาการทำดัชนี และ n คือ จำนวนเอกสารที่ประกอบด้วยคำเฉพาะ

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

ประเภทใดประเภทหนึ่งที่พบมากที่สุดที่ใช้ในการดึงรุ่นเก่าเป็นที่รู้จักกัน tf.idf
น้ำหนัก มีหลายรูปแบบของน้ำหนักเหล่านี้มี แต่พวกเขาทั้งหมดอยู่บนพื้นฐานของ
การรวมกันของความถี่หรือจำนวนที่เกิดขึ้นในระยะดัชนีในเอกสาร
(ความถี่ระยะหรือ TF) และความถี่ของการเกิดคำดัชนีที่ผ่าน
การเก็บรวบรวมทั้งหมดของเอกสาร ( ความถี่เอกสารผกผันหรือ IDF) น้ำหนัก IDF
เรียกว่าความถี่เอกสารผกผันเพราะจะช่วยให้น้ำหนักสูงถึงข้อตกลงที่
เกิดขึ้นในเอกสารน้อยมาก สูตรทั่วไปสำหรับ IDF เป็น logn / n, whereN คือจำนวนของเอกสารที่จัดทำดัชนีโดยเครื่องมือค้นหาและ n คือจำนวนของ
เอกสารที่มีคำใดคำหนึ่ง

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

หนึ่งในประเภทที่พบมากที่สุดที่ใช้ในการสืบค้นแบบเก่าเป็นที่รู้จักกันเป็น tf.idfน้ำหนัก . มีหลายรูปแบบของน้ำหนักเหล่านี้ แต่พวกเขาทั้งหมดขึ้นอยู่กับการรวมกันของความถี่ หรือจำนวนของดัชนีในระยะที่เกิดขึ้นในเอกสาร( ระยะเวลา ความถี่ หรือ TF ) และความถี่ของการเกิดดัชนีในระยะมากกว่าคอลเลกชันทั้งหมดของเอกสาร ( ความถี่เอกสารผกผันหรือ IDF ) IDF น้ำหนักเรียกว่าความถี่เอกสารผกผัน เพราะมันทำให้น้ำหนักสูงในแง่ที่เกิดขึ้นในเอกสารน้อยมาก สูตรทั่วไปสำหรับ IDF เป็นอัจฉริยะ / n wheren คือจำนวนของเอกสารการจัดทำดัชนีโดยเครื่องมือค้นหาและ n คือจำนวนของเอกสารที่ประกอบด้วยคำที่เฉพาะเจาะจง

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.