The second document has a higher sc

The second document has a higher score because it has a high weight for the first
term, which also has a high weight in the query. Even this simple example shows
that ranking based on the vector space model is able to reflect term importance
and the number of matching terms, which is not possible in Boolean retrieval.
In this discussion, we have yet to say anything about the form of the term
weighting used in the vector space model. Infact, many different weighting schemes
have been tried over the years. Most of these are variations on tf.idf weighting,
which was described briefly in Chapter 2. The term frequency component, tf, reflects
the importance of a term in a document Di (or query). This is usually computed
as a normalized count of the term occurrences in a document, for example
by

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

เอกสารสองได้คะแนนสูงขึ้นเนื่องจากมีน้ำหนักสูงสำหรับครั้งแรกระยะ ซึ่งมีน้ำหนักสูงในแบบสอบถาม แม้อย่างนี้ง่าย ๆ แสดงที่จัดอันดับจากแบบเวกเตอร์เป็นสิ่งสะท้อนให้เห็นถึงความสำคัญของระยะและจำนวนของเงื่อนไขตรงกัน ซึ่งเป็นไปไม่ได้ในการดึงบูลีนในการอภิปรายนี้ เรายังไม่ได้พูดอะไรเกี่ยวกับรูปแบบของคำน้ำหนักที่ใช้ในรูปแบบเวกเตอร์ มีแจ็คพ็อต น้ำหนักแตกต่างกันหลายแบบมีการพยายามในปี สิ่งต่าง ๆ เหล่านี้เปลี่ยนแปลงในน้ำหนัก tf.idfซึ่งถูกอธิบายไว้สั้น ๆ ในบทที่ 2 ส่วนประกอบความถี่ระยะ tf สะท้อนความสำคัญของคำในเอกสาร Di (หรือแบบสอบถาม) นี้มักจะคำนวณเป็นจำนวนเหตุการณ์ระยะในเอกสาร ตัวอย่างมาตรฐานโดย

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

เอกสารที่สองมีคะแนนที่สูงขึ้นเพราะมีน้ำหนักสูงเป็นครั้งแรก
ในระยะที่ยังมีน้ำหนักสูงในแบบสอบถาม แม้ตัวอย่างง่ายๆนี้แสดงให้เห็น
ว่าการจัดอันดับขึ้นอยู่กับพื้นที่แบบเวกเตอร์สามารถที่จะสะท้อนให้เห็นถึงความสำคัญในระยะ
และจำนวนคำที่ตรงกับที่เป็นไปไม่ได้ในการดึงบูลีน.
ในการสนทนานี้เรายังไม่ได้พูดอะไรเกี่ยวกับรูปแบบของคำว่า
น้ำหนักที่ใช้ในพื้นที่แบบเวกเตอร์ Infact หลายรูปแบบถ่วงน้ำหนักที่แตกต่างกัน
มีการพยายามในช่วงหลายปี ส่วนใหญ่เหล่านี้มีรูปแบบในการถ่วงน้ำหนัก tf.idf,
ซึ่งอธิบายสั้น ๆ ในบทที่ 2 องค์ประกอบความถี่ระยะลุยสะท้อนให้เห็นถึง
ความสำคัญของคำในเอกสาร Di (หรือแบบสอบถาม) เดอะ นี้มักจะคำนวณ
เป็นจำนวนปกติเกิดขึ้นในระยะในเอกสารตัวอย่างเช่น
โดย

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

เอกสารที่ 2 มีคะแนนสูงกว่าเพราะมีน้ำหนักสูง สำหรับครั้งแรกในระยะสั้น ซึ่งมีน้ำหนักมากในการ ตัวอย่างนี้แสดงให้เห็นถึงง่ายการจัดอันดับขึ้นอยู่กับว่าปริภูมิเวกเตอร์แบบ สามารถสะท้อนให้เห็นถึงความสำคัญของระยะและจำนวนที่ตรงกับเงื่อนไขที่เป็นไปไม่ได้ในการสืบค้นแบบบูลีน .ในการสนทนานี้ เรายังไม่ได้พูดเกี่ยวกับเรื่องรูปแบบของระยะน้ำหนักที่ใช้ในปริภูมิเวกเตอร์แบบ Infact , แผนการน้ำหนักที่แตกต่างกันมากได้พยายามมาหลายปี ส่วนใหญ่ของเหล่านี้เป็นรูปแบบใน tf.idf แทนที่ที่ได้รับการอธิบายสั้น ๆ ในบทที่ 2 ความถี่ระยะยาวส่วนประกอบ , TF , สะท้อนความสำคัญของระยะเวลาในเอกสารตี้ ( หรือแบบสอบถาม ) นี้มักจะคำนวณเป็นปกตินับคำว่าเหตุการณ์ในเอกสาร ตัวอย่างเช่นโดย

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.