Historically, it was very important in introducing these concepts, and effective
techniques have been developed through years of experimentation. As a retrieval
model, however, it has major flaws. Although it provides a convenient computational
framework, it provides little guidance on the details of how weighting and
ranking algorithms are related to relevance.
In this model, documents and queries are assumed to be part of at-dimensional
vector space, wheret is the number of index terms (words, stems, phrases, etc.). A
document Di
is represented by a vector of index terms:
ในอดีต , มันเป็นสิ่งสำคัญมากในการแนะนำแนวคิดเหล่านี้ และมีประสิทธิภาพเทคนิคที่ได้รับการพัฒนาผ่านปีของการทดลอง โดยการสืบค้นรูปแบบ , แต่ก็มีข้อเสียที่สำคัญ แม้ว่าจะให้สะดวก การคำนวณกรอบ , ให้คำแนะนำเล็ก ๆน้อย ๆในรายละเอียดของวิธีการและน้ำหนักขั้นตอนวิธีการจัดอันดับเกี่ยวข้องกับความเกี่ยวข้องในรูปแบบเอกสารและแบบสอบถามจะถือว่าเป็นส่วนหนึ่งของมิติพื้นที่เวกเตอร์ wheret คือจำนวนของข้อตกลง ( ดัชนีคำ , ลำต้น , วลี , ฯลฯ ) เป็นเอกสาร ดิจะถูกแทนด้วยเวกเตอร์ของแง่ดัชนี :
การแปล กรุณารอสักครู่..
