In the second line, we split the sc

In the second line, we split the score into the words that occur in the document and those that don’t occur (fqi;D = 0). In the third line, we add to the last term and subtract it from the first (where it ends up in the denominator), so there is no net effect. The last term is now the same for all documents andcan be ignored for ranking. The final expression gives the document score in terms of a “weight” for matching query terms. Although this weight is not identical to
a tf.idf weight, there are clear similarities in that it is directly proportional to the document term frequency and inversely proportional to the collection frequency. A different form of estimation, and one that is generally more effective, comes
from using a value of αD that is dependent on document length. This approach is known as Dirichlet smoothing, for reasons we will discuss later, and uses

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

ในบรรทัดสอง เราแบ่งคะแนนเป็นคำที่เกิดขึ้นในเอกสารและที่ไม่เกิดขึ้น (fqi; D = 0) ในบรรทัดสาม เราเพิ่มในระยะสุดท้าย และลบจากครั้งแรก (ที่มันจบลงในตัวหาร), จึงไม่มีผลสุทธิ ตอนนี้ที่เหมือนกันสำหรับ andcan ทั้งหมดในเอกสารละเว้นสำหรับการจัดอันดับเป็นระยะสุดท้าย การแสดงออกสุดท้ายให้คะแนนเอกสารในแง่ของ "น้ำหนัก" สำหรับคำถามที่ตรงกัน ถึงแม้ว่าน้ำหนักนี้ไม่เหมือนกับน้ำหนัก tf.idf มีความชัดเจนเหมือนที่เป็นสัดส่วนโดยตรงกับความถี่ระยะเวลาเอกสาร และสัดส่วนตรงกันข้ามกับความถี่ที่รวบรวม แบบที่แตกต่างของการประเมิน และเป็นหนึ่งที่โดยทั่วไป มาจากการใช้ค่า αD ที่ขึ้นอยู่กับความยาวของเอกสาร วิธีการนี้เรียกว่า Dirichlet ปรับให้เรียบ เหตุผลที่เราจะพูดคุยในภายหลัง และใช้

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

ในบรรทัดที่สองเราแบ่งคะแนนเป็นคำที่เกิดขึ้นในเอกสารและผู้ที่ไม่ได้เกิดขึ้น (fqi; D = 0) ในบรรทัดที่สามเราเพิ่มระยะสุดท้ายและลบมันจากครั้งแรก (ที่มันจบลงในตัวหาร) ดังนั้นจึงไม่มีผลกระทบสุทธิ ระยะสุดท้ายคือตอนนี้เหมือนกันสำหรับเอกสารทั้งหมด andcan ถูกละเว้นสำหรับการจัดอันดับ การแสดงออกสุดท้ายให้คะแนนของเอกสารในแง่ของ "น้ำหนัก" สำหรับการจับคู่คำค้นหา แม้ว่าน้ำหนักนี้ไม่ได้เป็นเหมือนกันกับ
น้ำหนัก tf.idf ที่มีความคล้ายคลึงกันที่ชัดเจนในการที่จะเป็นสัดส่วนโดยตรงกับความถี่ระยะเอกสารและสัดส่วนผกผันกับความถี่ในคอลเลกชัน รูปแบบที่แตกต่างกันของการประมาณค่าและหนึ่งที่โดยทั่วไปมีประสิทธิภาพมากขึ้นมา
จากการใช้ค่าของαDว่าจะขึ้นอยู่กับความยาวของเอกสาร วิธีการนี้เป็นที่รู้จักกัน Dirichlet เรียบสำหรับเหตุผลที่เราจะพูดถึงต่อมาและการใช้งาน

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

ในบรรทัดที่สอง เราแบ่งคะแนนเป็นคำที่มีอยู่ในเอกสารและผู้ที่ไม่ได้เกิดขึ้น ( fqi ; D = 0 ) ในบรรทัดที่สาม เราเพิ่มระยะสุดท้าย และ หักออกจากตัวแรก ( ที่สิ้นสุดขึ้นในตัวส่วน ) ดังนั้นจึงไม่มีผลสุทธิ ข้อสุดท้าย คือตอนนี้เหมือนกับเอกสารทั้งหมด andcan ถูกละเว้นสำหรับการจัดอันดับ การแสดงออกสุดท้ายให้เอกสารคะแนนในแง่ของ " น้ำหนัก " ที่ตรงกับเงื่อนไขการ แต่น้ำหนักนี้ไม่เหมือนเป็น tf.idf น้ำหนัก มีความคล้ายคลึงกันในการที่จะเป็นชัดเจนเป็นสัดส่วนโดยตรงกับเอกสารระยะความถี่ และแปรผกผันกับคอลเลกชันที่ความถี่ แบบฟอร์มที่แตกต่างกันของการประมาณค่า และหนึ่งที่โดยทั่วไปมีประสิทธิภาพมากขึ้นมาจากการใช้ค่าของα D นั้นจะขึ้นอยู่กับความยาวของเอกสาร วิธีการนี้เรียกว่าดีริชเลต์เรียบ สำหรับเหตุผลที่เราจะหารือในภายหลัง และใช้

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.