Theform of query term weighting is

Theform of query term weighting is essentially the same. Adding 1 to the termfrequency
component ensures that terms with frequency 1 have a non-zero weight.
Note that, in this model, term weights are computed only for terms that occur in
the document (or query). Given that the cosine measure normalization is incorporated
into the weights, the score for a document is computed using simply the
dot product of the document and query vectors.
Although there is no explicit definition of relevance in the vector space model,
there is an implicit assumption that relevance is related to the similarity of query
and document vectors. In other words, documents “closer” to the query are more
likely to be relevant. This is primarily a model of topical relevance, although features
related to user relevance could be incorporated into the vector representation.
No assumption is made about whether relevance is binary or multivalued.
In the last chapter we described relevance feedback, a technique for query
modification based on user-identified relevant documents. This technique was
first introduced using the vector space model. The well-known Rocchio algorithm
(Rocchio, 1971) was based on the concept of an optimal query, which maximizes
the difference between the average vector representing the relevant documents
and the average vector representing the non-relevant documents. Given that only
limited relevance information is typically available, the most common (and effective)
form of the Rocchio algorithm modifies the initial weights in query vector
Q to produce a new query Q′
according to

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

Theform ของแบบสอบถามระยะน้ำหนักเป็นหลักเดียวกัน เพิ่ม 1 ตัว termfrequencyส่วนประกอบใจว่า เงื่อนไข มีความถี่ 1 มีน้ำหนักไม่ใช่ศูนย์หมายเหตุว่า ในรูปแบบนี้ คำว่าน้ำหนักใช้คำนวณเท่านั้นสำหรับเงื่อนไขที่เกิดขึ้นในเอกสาร (แบบสอบถาม) ระบุว่ารวมไว้ที่การฟื้นฟูวัดโคไซน์เป็นน้ำหนัก คะแนนสำหรับเอกสารคำนวณโดยใช้เพียงแค่การผลคูณจุดของเวกเตอร์เอกสารและแบบสอบถามแม้ว่าไม่มีนิยามที่ชัดเจนของความเกี่ยวข้องในรูปแบบเวกเตอร์มีข้อสมมติฐานนัยว่า ความเกี่ยวข้องเกี่ยวข้องกับความคล้ายกันของแบบสอบถามและเวกเตอร์เอกสาร ในคำอื่น ๆ มีเอกสาร "ใกล้ชิด" กับการสอบถามเพิ่มเติมแนวโน้มที่จะเกี่ยวข้องกัน นี้เป็นหลักรูปแบบของความเกี่ยวข้องเฉพาะ แม้ว่าคุณลักษณะที่เกี่ยวข้องกับผู้เกี่ยวข้องอาจจะรวมอยู่ในการแสดงเวกเตอร์อัสสัมชัญไม่ได้เกี่ยวกับว่าเกี่ยวข้องเป็นไบนารี หรือหลายค่าในบทสุดท้าย ที่เราอธิบายความเกี่ยวข้องสนอง เทคนิคสำหรับการสอบถามปรับเปลี่ยนตามผู้ใช้ที่มีระบุเอกสารที่เกี่ยวข้อง เทคนิคนี้ถูกก่อน นำมาใช้โดยใช้รูปแบบเวกเตอร์ อัลกอริทึม Rocchio รู้จัก(Rocchio, 1971) ตามแนวคิดของการที่ดีที่สุดสอบถาม ซึ่งเพิ่มความแตกต่างระหว่างเวคเตอร์เฉลี่ยที่เป็นตัวแทนของเอกสารเกี่ยวข้องและเวกเตอร์เฉลี่ยที่เป็นตัวแทนของเอกสารไม่เกี่ยวข้อง ระบุว่าเท่านั้นจำกัดความเกี่ยวข้องมีข้อมูลปกติ ส่วนมาก (และมีประสิทธิภาพ)ปรับเปลี่ยนรูปแบบของอัลกอริทึม Rocchio น้ำหนักเริ่มต้นในเวกเตอร์แบบสอบถามQ การผลิตแบบสอบถามใหม่ Q′ตามที่

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

ฟอร์มของน้ำหนักของคำเป็นหลักเดียวกัน เพิ่ม 1 ถึง termfrequency
องค์ประกอบเพื่อให้แน่ใจว่าข้อตกลงกับความถี่ 1 มีน้ำหนักไม่ใช่ศูนย์.
ทราบว่าในรุ่นนี้น้ำหนักจะคำนวณระยะเพียงคำที่เกิดขึ้นใน
เอกสาร (หรือแบบสอบถาม) ระบุว่าการฟื้นฟูวัดโคไซน์เป็นนิติบุคคลที่จัดตั้ง
เข้าไปน้ำหนักคะแนนสำหรับเอกสารที่มีการคำนวณโดยใช้เพียงแค่
คูณจุดของเอกสารและแบบสอบถามพาหะ.
แม้จะไม่มีคำนิยามที่ชัดเจนของความสัมพันธ์กันในแบบจำลองปริภูมิเวกเตอร์ที่
มีการสันนิษฐานโดยปริยาย ความสัมพันธ์กันว่ามีความเกี่ยวข้องกับความคล้ายคลึงกันของแบบสอบถาม
และเอกสารเวกเตอร์ ในคำอื่น ๆ เอกสาร "ใกล้ชิด" ในแบบสอบถามมี
แนวโน้มที่จะมีความเกี่ยวข้อง นี้เป็นหลักรูปแบบของความสัมพันธ์กันเฉพาะแม้ว่าคุณลักษณะ
ที่เกี่ยวข้องกับความสัมพันธ์กันผู้ใช้สามารถรวมเข้ากับการแสดงเวกเตอร์.
ไม่มีสมมติฐานที่ทำเกี่ยวกับว่าความสัมพันธ์กันเป็นไบนารีหรือหลายค่า.
ในบทสุดท้ายที่เราอธิบายข้อเสนอแนะความสัมพันธ์กันเทคนิคสำหรับการค้นหา
การปรับเปลี่ยนตาม ในเอกสารที่เกี่ยวข้องใช้ระบุ เทคนิคนี้จะได้รับการ
เปิดตัวครั้งแรกโดยใช้แบบจำลองพื้นที่เวกเตอร์ ที่รู้จักกันดี Rocchio อัลกอริทึม
(Rocchio, 1971) ก็ขึ้นอยู่กับแนวคิดของแบบสอบถามที่ดีที่สุดซึ่งจะเพิ่ม
ความแตกต่างระหว่างเวกเตอร์เฉลี่ยคิดเป็นเอกสารที่เกี่ยวข้อง
และเวกเตอร์เฉลี่ยคิดเป็นเอกสารที่ไม่เกี่ยวข้อง ระบุว่าเฉพาะ
ข้อมูลที่เกี่ยวข้องจำนวน จำกัด บริการโดยทั่วไปที่พบมากที่สุด (และมีประสิทธิภาพ)
รูปแบบของอัลกอริทึม Rocchio ปรับเปลี่ยนน้ำหนักเริ่มต้นในการค้นหาเวกเตอร์
Q เพื่อผลิตแบบสอบถาม Q 'ใหม่
ตาม

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

รูปของดัชนีในระยะแบบสอบถามเป็นหลักเดียวกัน เพิ่ม 1 ที่ termfrequencyส่วนเพื่อให้แน่ใจว่าเงื่อนไขที่มีความถี่ 1 มีน้ำหนักไม่เป็น .หมายเหตุ ที่ในรุ่นนี้จะคำนวณระยะน้ำหนักเพียงเงื่อนไขที่เกิดขึ้นในเอกสาร ( หรือแบบสอบถาม ) ระบุว่ามาตรการต่างๆบรรทัดฐานเป็นส่วนประกอบลงไปในน้ำหนักคะแนนสำหรับเอกสารที่ถูกคำนวณโดยใช้เพียงแค่จุดเวกเตอร์ผลิตภัณฑ์ของเอกสารและแบบสอบถามแม้ว่าไม่มีนิยามที่ชัดเจนของความเกี่ยวข้องในปริภูมิเวกเตอร์แบบมีการสันนิษฐานโดยนัยที่เกี่ยวข้องเกี่ยวข้องกับความเหมือนกันของแบบสอบถามเวกเตอร์และเอกสาร ในคำอื่น ๆ , เอกสาร " ใกล้ชิด " เพื่อสอบถามเพิ่มเติมอาจจะเกี่ยวข้อง นี้เป็นหลักรูปแบบของความเกี่ยวข้องแม้ว่าคุณลักษณะที่เกี่ยวข้องกับ , ผู้ใช้อาจจะรวมเข้ากับเวกเตอร์ตัวแทนไม่มีสมมติฐานเป็นเกี่ยวกับว่า Ltd เป็นไบนารีหรือ multivalued .ในบทสุดท้ายที่เราอธิบาย , ข้อเสนอแนะ , เทคนิคเพื่อสอบถามการปรับเปลี่ยนขึ้นอยู่กับผู้ใช้ระบุเอกสารที่เกี่ยวข้อง เทคนิคนี้คือแนะนำการใช้ปริภูมิเวกเตอร์แบบ ขั้นตอนวิธี rocchio รู้จักกันดี( rocchio 1971 ) ตามแนวคิดของแบบสอบถามที่เหมาะสมซึ่งจะเพิ่มความแตกต่างระหว่างค่าเฉลี่ยที่แสดงเอกสารเวกเตอร์และค่าเฉลี่ยของเวกเตอร์แทนไม่เกี่ยวข้อง เอกสาร ระบุว่าเพียงข้อมูลที่เกี่ยวข้อง จำกัด มักจะใช้ได้ทั่วไปมากที่สุด ( และมีประสิทธิภาพ )รูปแบบของ rocchio ขั้นตอนวิธีปรับเปลี่ยนน้ำหนักเริ่มต้นในรูปแบบสอบถามQ Q ได้รับการผลิตใหม่สอบถามตาม

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.