Although this document score sums t

Although this document score sums term weights for just the matching query terms, with relevance feedback the query can be expanded to include other important terms from the relevant set. Note that if we have no relevance information, we can set r and R to 0, which would give a pi value of 0.5, and would produce the idf-like term weight discussed before.
So how good is this document score when used for ranking? Not very good, it turns out. Although it does provide a method of incorporating relevance information,in most cases we don’t have this information and instead would be using term weights that are similar to idf weights. The absence of a tf component makes a significant difference to the effectiveness of the ranking, and most effectiveness measures will drop by about 50% if the ranking ignores this information.
This means, for example, that we might see 50% fewer relevant documents in the top ranks if we used the binary independence model ranking instead of the best tf.idf ranking.
It turns out, however, that the binary independence model is the basis for one of the most effective and popular ranking algorithms, known as BM25.

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

ถึงแม้ว่าคะแนนเอกสารนี้รวมน้ำหนักระยะสำหรับการเพียงการจับคู่ เงื่อนไขแบบสอบถาม มีความคิดเห็นเกี่ยวการสอบถามสามารถขยายการรวมเงื่อนไขสำคัญอื่น ๆ จากการตั้งค่าที่เกี่ยวข้อง หมายเหตุที่ ถ้าเรามีข้อมูลไม่มีความเกี่ยวข้อง เราสามารถตั้งค่า r และ R เป็น 0 ซึ่งจะให้ค่า pi เป็น 0.5 และจะผลิตคำ idf เหมือนน้ำหนักกล่าวถึงก่อนดังนั้นวิธีที่ดีคือคะแนนเอกสารนี้ใช้สำหรับการจัดอันดับอะไร ดี มันเปิดออก แม้ว่าจะมีวิธีการผสมผสานข้อมูลความเกี่ยวข้อง ในกรณีส่วนใหญ่ เราไม่มีข้อมูลนี้ แล้วแทน จะใช้คำว่าน้ำหนักที่คล้ายกับ idf น้ำหนัก การขาดงานของคอมโพเนนต์ tf ทำให้ความแตกต่างที่สำคัญประสิทธิภาพของการจัดอันดับ และมาตรการส่วนใหญ่ประสิทธิภาพจะลดลงประมาณ 50% ถ้าละเว้นการจัดลำดับข้อมูลนี้ซึ่งหมายความว่า เช่น ที่เราอาจเห็นในการจัดอันดับด้านบนเอกสารที่เกี่ยวข้องน้อยลง 50% ถ้าเราใช้แบบไบนารีเอกราชจัดอันดับแทนการจัดอันดับที่ดีที่สุดของ tf.idfมันเปิดออก อย่างไรก็ตาม ว่า แบบไบนารีเป็นอิสระเป็นพื้นฐานสำหรับการมีประสิทธิภาพมากที่สุด และเป็นที่นิยมอันดับอัลกอริทึม เรียกว่า BM25 อย่างใดอย่างหนึ่ง

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

แม้ว่าคะแนนของเอกสารนี้สรุปน้ำหนักคำเพียงคำค้นหาที่ตรงกันกับข้อเสนอแนะความสัมพันธ์กันแบบสอบถามสามารถขยายไปถึงข้อตกลงที่สำคัญอื่น ๆ จากชุดที่เกี่ยวข้อง โปรดทราบว่าถ้าเรามีข้อมูลที่เกี่ยวข้องไม่มีเราสามารถตั้งค่า R และ R เป็น 0 ซึ่งจะให้ค่า Pi 0.5 และจะผลิต IDF-เช่นน้ำหนักในระยะที่กล่าวถึงก่อน.
ดังนั้นวิธีที่ดีคือคะแนนของเอกสารนี้เมื่อนำมาใช้สำหรับการจัดอันดับ ? ไม่ดีมากก็จะเปิดออก แม้ว่ามันจะไม่ให้วิธีการของการผสมผสานข้อมูลความสัมพันธ์กันในกรณีส่วนใหญ่เราไม่ได้มีข้อมูลนี้และแทนจะใช้น้ำหนักระยะที่คล้ายกับน้ำหนัก IDF กรณีที่ไม่มีส่วนประกอบ TF ทำให้ความแตกต่างอย่างมีนัยสำคัญเพื่อประสิทธิภาพของการจัดอันดับและส่วนใหญ่มาตรการที่มีประสิทธิภาพจะลดลงประมาณ 50% หากการจัดอันดับละเว้นข้อมูลนี้.
ซึ่งหมายความว่าเช่นว่าเราอาจจะเห็นเอกสารที่เกี่ยวข้อง 50% น้อยกว่าใน อันดับบนสุดถ้าเราใช้รูปแบบการจัดอันดับเป็นอิสระไบนารีแทนการจัดอันดับที่ดีที่สุด tf.idf.
มันจะเปิดออก แต่ที่รูปแบบอิสระไบนารีเป็นพื้นฐานสำหรับการหนึ่งที่มีประสิทธิภาพมากที่สุดและเป็นที่นิยมขั้นตอนวิธีการจัดอันดับเป็นที่รู้จัก BM25

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

แม้ว่าเอกสารคะแนนผลรวมระยะน้ำหนักเพียงแค่การจับคู่คำ แบบสอบถามที่มีความเกี่ยวข้องการตอบรับแบบสอบถามสามารถขยายไปยังรวมถึงข้อตกลงที่สำคัญอื่น ๆจากการตั้งค่าที่เกี่ยวข้อง หมายเหตุว่า ถ้าเราไม่มีความเกี่ยวข้องของข้อมูลที่เราสามารถตั้งค่า R และ R เป็น 0 ซึ่งจะให้พีค่า 0.5 และจะผลิตน้อยอย่างหนักในระยะกล่าวถึงก่อนดังนั้น วิธีที่ดีคือ เอกสาร นี้ คะแนน เมื่อใช้ในการจัดอันดับ ? ไม่เก่ง มันเปิดออก แม้ว่าจะให้วิธีการของการผสมผสานข้อมูลที่เกี่ยวข้องในกรณีส่วนใหญ่เราไม่ได้มีข้อมูลนี้และแทนจะใช้คำที่คล้ายกันเพื่อป้องกันน้ำหนักน้ำหนัก การขาดงานของ TF ส่วนประกอบที่ทำให้ความแตกต่างในประสิทธิภาพของการจัดอันดับและการวัดประสิทธิผลมากที่สุดจะลดลงถึงร้อยละ 50 หากการจัดอันดับละเว้นข้อมูลนี้หมายถึง เช่น เราอาจเห็น 50 % น้อยกว่า เอกสารที่เกี่ยวข้องในการจัดอันดับด้านบนถ้าเราใช้รูปแบบอิสระไบนารีการจัดอันดับแทนการจัดอันดับ tf.idf ที่ดีที่สุดมันจะเปิดออก , อย่างไรก็ตาม , ว่ารูปแบบอิสระเลขฐานสองเป็นพื้นฐานอย่างหนึ่งของขั้นตอนวิธีการจัดอันดับมีประสิทธิภาพ และเป็นที่นิยมมากที่สุด เรียกว่า bm25 .

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.