where qj is the initial weight of query term j, Rel is the set of identified relevant documents, Nonrel is the set of non-relevant documents, |.| gives the size of a set, dij is the weight of the jth term in document i, and α, β, and γ are parameters that control the effect of each component. Previous studies have shown that the set of non-relevant documents is best approximated by all unseen documents
(i.e., all documents not identified as relevant), and that reasonable values for the parameters are 8, 16, and 4 for α, β, and γ, respectively.
This formula modifies the query term weights by adding a component based on the average weight in the relevant documents and subtracting a component based on the average weight in the non-relevant documents. Query terms with weights that are negative are dropped. This results in a longer or expanded query because terms that occur frequently in the relevant documents but not in the original query will be added (i.e., they will have non-zero positive weights in the modified query). To restrict the amount of expansion, typically only a certain number (say, 50) of the terms with the highest average weights in the relevant documents will be added to the query.
ที่ QJ คือน้ำหนักเริ่มต้นของ J ระยะแบบสอบถาม Rel คือชุดของเอกสารที่เกี่ยวข้องระบุ, Nonrel เป็นชุดของเอกสารที่ไม่เกี่ยวข้อง. | | ทำให้ขนาดของชุดที่ dij เป็นน้ำหนักของระยะ jth ในเอกสาร i และα, βและγคือตัวแปรที่ควบคุมผลกระทบของแต่ละองค์ประกอบ การศึกษาก่อนหน้านี้ได้แสดงให้เห็นว่าชุดของเอกสารที่ไม่เกี่ยวข้องเป็นห้วงที่ดีที่สุดโดยเอกสารที่มองไม่เห็นทั้งหมด
(เช่นเอกสารทั้งหมดที่ไม่ได้ระบุว่าเป็นที่เกี่ยวข้อง) และค่าที่เหมาะสมสำหรับพารามิเตอร์ที่ 8, 16, และ 4 สำหรับα, βและ γตามลำดับ.
สูตรนี้ปรับเปลี่ยนน้ำหนักของคำโดยการเพิ่มองค์ประกอบที่ขึ้นอยู่กับน้ำหนักเฉลี่ยอยู่ในเอกสารที่เกี่ยวข้องและลบส่วนประกอบขึ้นอยู่กับน้ำหนักเฉลี่ยในเอกสารที่ไม่เกี่ยวข้อง คำค้นหาที่มีน้ำหนักที่เป็นลบจะลดลง ซึ่งจะส่งผลในแบบสอบถามอีกต่อไปหรือขยายเพราะคำที่เกิดขึ้นบ่อยครั้งในเอกสารที่เกี่ยวข้อง แต่ไม่ได้อยู่ในแบบสอบถามเดิมจะถูกเพิ่ม (เช่นพวกเขาจะต้องไม่เป็นศูนย์น้ำหนักในเชิงบวกในการปรับเปลี่ยนแบบสอบถาม) ที่จะ จำกัด จำนวนเงินของการขยายตัวโดยทั่วไปเพียงจำนวนหนึ่ง (พูด, 50) ของข้อตกลงที่มีน้ำหนักเฉลี่ยสูงสุดในเอกสารที่เกี่ยวข้องจะถูกเพิ่มในแบบสอบถาม
การแปล กรุณารอสักครู่..

ที่ QJ เป็นน้ำหนักของแบบสอบถามในระยะ J , รถไฟเป็นชุดของการระบุเอกสารที่เกี่ยวข้อง nonrel คือชุดของไม่เกี่ยวข้อง เอกสาร | . | ช่วยให้ขนาดของชุด dij คือน้ำหนักของ jth เงื่อนไขในเอกสาร และαบีตา และγ , มีพารามิเตอร์ที่ควบคุมการผล ของแต่ละองค์ประกอบ การศึกษาก่อนหน้านี้ได้แสดงให้เห็นว่าชุดของเอกสารที่เกี่ยวข้องไม่ที่ดีที่สุดโดยประมาณตามเอกสารที่ทั้งหมด( เช่น เอกสารไม่ระบุที่ ) , และค่าที่เหมาะสมสำหรับตัวแปร คือ 8 , 16 , และ 4 สำหรับαบีตา และγ , ตามลำดับสูตรนี้จะปรับเปลี่ยนแบบสอบถามในระยะน้ำหนักโดยการเพิ่มองค์ประกอบขึ้นอยู่กับน้ำหนักเฉลี่ยในเอกสารที่เกี่ยวข้อง และลบองค์ประกอบขึ้นอยู่กับน้ำหนักเฉลี่ยในไม่เกี่ยวข้อง เอกสาร สอบถามเรื่องน้ำหนักที่เป็นลบจะลดลง ผลนี้ในการขยายอีกต่อไปหรือสอบถามเพราะเงื่อนไขที่เกิดขึ้นบ่อยในเอกสารที่เกี่ยวข้อง แต่ไม่ได้อยู่ในแบบสอบถามต้นฉบับจะถูกเพิ่ม ( เช่นที่พวกเขาจะไม่เป็นบวก น้ำหนักในการแก้ไขแบบสอบถาม ) การ จำกัด จำนวนของการขยายตัว โดยทั่วไปเพียงหนึ่งหมายเลข ( พูด , 50 ) ของข้อตกลงกับน้ำหนักเฉลี่ยสูงสุดในเอกสารจะถูกเพิ่มไปยังการ
การแปล กรุณารอสักครู่..
