where tfik is the term frequency we

where tfik is the term frequency weight of term k in document Di, and fik is the number of occurrences of term k in the document. In the vector space model, normalization is part of the cosine measure. A document collection can contain documents of many different lengths. Although normalization accounts for this to some degree, long documents can have many terms occurring once and others occurring hundreds of times. Retrieval experiments have shown that to reduce the impact of these frequent terms, it is effective to use the logarithm of the number of term occurrences in tf weights rather than the raw count

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

ที่ tfik น้ำหนักระยะความถี่ของคำ k ในเอกสาร Di และ fik คือ หมายเลขของเหตุการณ์ของคำ k ในเอกสาร ในรูปแบบเวกเตอร์ ฟื้นฟูเป็นส่วนหนึ่งของการวัดค่าโคไซน์ คอลเลกชันเอกสารสามารถประกอบด้วยเอกสารความยาวต่างกันมาก แม้ว่าปกติบัญชีนี้ในระดับหนึ่ง เอกสารที่ยาวได้หลายเงื่อนไขเกิดขึ้นหนึ่งครั้งและอื่น ๆ เกิดขึ้นหลายร้อยเท่า เรียกการทดลองได้แสดงให้เห็นว่า เพื่อลดผลกระทบของข้อกำหนดเหล่านี้บ่อยครั้ง การค่าลอการิทึมของจำนวนระยะใน tf น้ำหนักมากกว่าจำนวนวัตถุดิบ

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

ที่ tfik คือน้ำหนักความถี่ระยะเวลาของ K คำในเอกสาร Di และ fik คือจำนวนของการเกิดขึ้นของ K คำในเอกสาร ในพื้นที่แบบเวกเตอร์, การฟื้นฟูเป็นส่วนหนึ่งของมาตรการโคไซน์ คอลเลกชันเอกสารสามารถมีเอกสารของความยาวแตกต่างกันมาก แม้ว่าบัญชีบรรทัดฐานสำหรับการศึกษาระดับปริญญาบางเอกสารขนาดยาวสามารถมีหลายคำที่เกิดขึ้นเพียงครั้งเดียวและคนอื่น ๆ ที่เกิดขึ้นหลายร้อยครั้ง การทดลองดึงได้แสดงให้เห็นว่าเพื่อลดผลกระทบของข้อตกลงที่พบบ่อยเหล่านี้จะมีประสิทธิภาพในการใช้ลอการิทึมของจำนวนของการเกิดขึ้นในระยะน้ำหนัก TF มากกว่านับดิบ

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

ที่ tfik คือความถี่ระยะน้ำหนักในระยะ K ในเอกสารดีและ fik คือจำนวนของการเกิดขึ้นของเงื่อนไข K ในเอกสาร ในปริภูมิเวกเตอร์แบบ บรรทัดฐาน เป็นส่วนหนึ่งของโคไซน์วัด เอกสารคอลเลกชันสามารถมีเอกสารของความยาวที่แตกต่างกันมาก แม้ว่าบัญชีบรรทัดฐานนี้ในระดับหนึ่ง , เอกสารนาน ก็มีเงื่อนไขมากมายที่เกิดขึ้นครั้งเดียวและผู้อื่นที่เกิดขึ้นหลายร้อยเท่า การทดลองแสดงให้เห็นว่าการลดผลกระทบของข้อตกลงบ่อยเหล่านี้จะมีประสิทธิภาพที่จะใช้ค่าลอการิทึมของจำนวนเงื่อนไขเหตุการณ์ใน TF น้ำหนักมากกว่านับวัตถุดิบ

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.