where tfik is the term frequency we

where tfik is the term frequency weight of term k in document Di
, and fik is
the number of occurrences of term k in the document. In the vector space model,
normalization is part of the cosine measure. A document collection can contain
documents of many different lengths. Although normalization accounts for this
to some degree, long documents can have many terms occurring once and others
occurring hundreds of times. Retrieval experiments have shown that to reduce the
impact of these frequent terms, it is effective to use the logarithm of the number
of term occurrences in tf weights rather than the raw count.
The inverse document frequency component (idf) reflects the importance of
the term in the collection of documents. The more documents that a term occurs
in, the less discriminating the term is between documents and, consequently, the
less useful it will be in retrieval. The typical form of this weight is

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

น้ำหนักระยะความถี่ของคำ k ในเอกสาร Di tfikและ fikจำนวน k คำในเอกสาร ในรูปแบบเวกเตอร์ฟื้นฟูเป็นส่วนหนึ่งของการวัดค่าโคไซน์ คอลเลกชันเอกสารสามารถประกอบด้วยเอกสารความยาวต่างกันมาก แม้ว่าปกติบัญชีนี้ในระดับหนึ่ง เอกสารที่ยาวได้หลายเงื่อนไขเกิดขึ้นหนึ่งครั้งและอื่น ๆเกิดขึ้นหลายร้อยเท่า เรียกการทดลองได้แสดงให้เห็นว่าการลดการผลกระทบข้อตกลงบ่อย มันมีประสิทธิภาพการใช้ลอการิทึมของจำนวนเกิดระยะใน tf น้ำหนักมากกว่าจำนวนวัตถุดิบส่วนประกอบความถี่เอกสารที่ผกผัน (idf) สะท้อนให้เห็นถึงความสำคัญของระยะเวลาในการเก็บเอกสาร เอกสารเพิ่มเติมที่เกิดขึ้นเป็นระยะใน การน้อยเหยียดพวกผิวว่าระหว่างเอกสาร และ จึงมีประโยชน์น้อยจะเป็นในการดึง รูปแบบทั่วไปของน้ำหนักนี้

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

ที่ tfik คือน้ำหนักความถี่ระยะเวลาของ K คำในเอกสาร Di
และ fik คือ
จำนวนการเกิดขึ้นของ K คำในเอกสาร ในพื้นที่แบบเวกเตอร์,
การฟื้นฟูเป็นส่วนหนึ่งของมาตรการโคไซน์ คอลเลกชันเอกสารสามารถมี
เอกสารของความยาวแตกต่างกันมาก แม้ว่าบัญชีบรรทัดฐานสำหรับเรื่องนี้
ในระดับหนึ่งเอกสารขนาดยาวสามารถมีหลายคำที่เกิดขึ้นเพียงครั้งเดียวและคนอื่น ๆ
ที่เกิดขึ้นหลายร้อยครั้ง การทดลองดึงได้แสดงให้เห็นว่าเพื่อลด
ผลกระทบของข้อตกลงที่พบบ่อยเหล่านี้จะมีประสิทธิภาพในการใช้ลอการิทึมของจำนวนที่
เกิดขึ้นในระยะน้ำหนัก TF มากกว่านับดิบ.
องค์ประกอบความถี่เอกสารผกผัน (IDF) สะท้อนให้เห็นถึงความสำคัญของ
คำว่า ในคอลเลกชันของเอกสาร เอกสารอื่น ๆ ที่เป็นคำที่เกิดขึ้น
ในที่น้อยกว่าแบ่งแยกระยะคือระหว่างเอกสารและดังนั้นที่
มีประโยชน์น้อยก็จะอยู่ในการดึง รูปแบบตามแบบฉบับของน้ำหนักนี้อยู่

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

ที่ tfik คือความถี่ระยะน้ำหนักในระยะ K ในเอกสาร ดิและ fik คือจำนวนของการเกิดขึ้นของเงื่อนไข K ในเอกสาร ในปริภูมิเวกเตอร์แบบนส่วนหนึ่งของโคไซน์ วัด เอกสารคอลเลกชัน สามารถ มีเอกสารของความยาวที่แตกต่างกันมาก แม้ว่าบัญชีบรรทัดฐานนี้เพื่อการศึกษาระดับปริญญาบางส่วนเอกสารนาน ก็มีเงื่อนไขมากมายที่เกิดขึ้นครั้งเดียวและคนอื่น ๆที่เกิดขึ้นหลายร้อยเท่า การทดลองแสดงให้เห็นว่าการลดผลกระทบของข้อตกลงบ่อยเหล่านี้จะมีประสิทธิภาพที่จะใช้ค่าลอการิทึมของจำนวนเงื่อนไขเหตุการณ์ใน TF น้ำหนักมากกว่านับวัตถุดิบความถี่เอกสารผกผัน ( IDF ) สะท้อนให้เห็นถึงองค์ประกอบสำคัญของระยะเวลาในการเก็บเอกสาร เพิ่มเติมเอกสารที่ยาวขึ้นใน น้อยกว่าค่าระยะระหว่างเอกสาร และ จากนั้นมีประโยชน์น้อยก็จะเรียก รูปแบบทั่วไปของน้ำหนักนี้

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.