In addition to features based on wo

In addition to features based on word occurrence, ri nodes
also represent proximity features. Proximity features take a number of different
forms, such as requiring words to co-occur within a certain “window” (length)
of text, and will be described in detail in the next section. Features that are not
based on language models, such as document date, are allowed but not shown in
this example.
The query nodes qi are used to combine evidence from representation nodes
and other query nodes. These nodes represent the occurrence of more complex evidence
and document features. A number of forms of combination are available,
with Boolean AND and OR being two of the simplest. The network as a whole
computes P(I|D, μ), which is the probability that an information need is met
given the document and the parameters μ. The information need node I is a special
query node that combines all of the evidence from the other query nodes into
a single probability or belief score. This score is used to rank documents. Conceptually,
this means we must evaluate an inference network for every document
in the collection, but as with every other ranking algorithm, indexes are used to
speed up the computation. In general, representation nodes are indexed, whereas
query nodes are specified for each query by the user or search application. This
means that indexes for a variety of proximity features, in addition to words, will be
created (as described in Chapter 5), significantly expanding the size of the indexes.
In some applications, the probabilities associated with proximity features are computed
at query time in order to provide more flexibility in specifying queries.

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

นอกจากคุณสมบัติตามคำเกิด โหนด riยัง แสดงถึงคุณสมบัติใกล้ คุณสมบัติใกล้เคียงใช้จำนวนแตกต่างกันรูปแบบ เช่นการให้คำที่จะเกิดขึ้นร่วมกันภายในบางอย่าง "หน้าต่าง" (ความยาว)ข้อความ และที่จะกล่าวในรายละเอียดในส่วนถัดไป คุณลักษณะที่ไม่อิงจากรุ่นภาษา เช่นวันในเอกสาร ได้ แต่ไม่แสดงในตัวอย่างนี้ใช้ชิโหนแบบสอบถามการรวมหลักฐานจากโหนดที่แสดงและโหนอื่น ๆ สอบถาม โหนเหล่านี้แสดงถึงการเกิดขึ้นของหลักฐานที่ซับซ้อนมากขึ้นและลักษณะของเอกสาร จำนวนรูปแบบของชุดที่มีอยู่ด้วย Boolean และและหรือมีสองง่ายที่สุด เครือข่ายทั้งหมดคำนวณ P(I| D μ), ซึ่งเป็นความน่าเป็นที่ต้องการข้อมูลเป็นไปตามรับเอกสารและμพารามิเตอร์ ข้อมูลที่ต้องโหนเป็นพิเศษโหนแบบสอบถามที่รวมทั้งหมดของหลักฐานจากโหนอื่น ๆ แบบสอบถามเป็นเดี่ยวเชื่อหรือน่าเป็นคะแนน คะแนนนี้จะใช้ในการจัดลำดับเอกสาร โดยหลักการซึ่งหมายความว่า เราต้องประเมินเครือข่ายสำหรับเอกสารอ้างอิงในคอลเลกชัน แต่ เป็นกับทุกอื่น ๆ อันดับอัลกอริทึม ดัชนีจะใช้ในการเพิ่มความเร็วในการคำนวณ ทั่วไป แสดงโหนมีการทำดัชนี ขณะที่โหนแบบสอบถามถูกกำหนดสำหรับแต่ละแบบสอบถาม โดยผู้ใช้หรือโปรแกรมประยุกต์ค้นหา นี้หมายความว่าดัชนีความหลากหลายของคุณสมบัติเช่น นอกเหนือจากคำ จะสร้างขึ้น (ตามที่อธิบายไว้ในบทที่ 5), อย่างมีนัยสำคัญขยายขนาดของดัชนีในบางโปรแกรมประยุกต์ คำนวณน่าจะเกี่ยวข้องกับคุณสมบัติใกล้เวลาสอบถามเพื่อเพิ่มความยืดหยุ่นในการระบุแบบสอบถามให้

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

นอกจากคุณสมบัติอยู่บนพื้นฐานของการเกิดคำโหนด ri
ยังเป็นตัวแทนของคุณลักษณะใกล้ชิด คุณสมบัติใกล้ชิดใช้จำนวนที่แตกต่างกันของ
รูปแบบเช่นต้องคำที่จะร่วมเกิดขึ้นภายในหน้าต่าง "" บางอย่าง (ความยาว)
ของข้อความและจะมีการอธิบายในรายละเอียดในส่วนถัดไป คุณลักษณะที่ไม่
อยู่บนพื้นฐานของรุ่นภาษาเช่นวันที่เอกสารที่ได้รับอนุญาต แต่ไม่แสดงใน
ตัวอย่างนี้.
แบบสอบถามโหนดฉีจะใช้ในการรวมหลักฐานจากโหนดตัวแทน
และต่อมน้ำแบบสอบถามอื่น ๆ โหนดเหล่านี้แสดงถึงการเกิดขึ้นของหลักฐานที่ซับซ้อนขึ้น
และคุณสมบัติเอกสาร จำนวนรูปแบบของการรวมกันที่มีอยู่
กับบูลีน AND และ OR เป็นสองที่ง่ายที่สุด เครือข่ายรวม
คำนวณ P (ฉัน | D, μ) ซึ่งเป็นความน่าจะเป็นว่าข้อมูลที่เป็นความต้องการที่จะพบ
ได้รับเอกสารและพารามิเตอร์μ ข้อมูลที่จำเป็นต้องโหนด I เป็นพิเศษ
โหนดแบบสอบถามที่รวมทั้งหมดของหลักฐานจากโหนดแบบสอบถามอื่น ๆ เข้าไปใน
ความน่าจะเป็นหรือความเชื่อคะแนนเดียว คะแนนนี้จะใช้ในการจัดอันดับเอกสาร แนวคิด
นี้หมายความว่าเราจะต้องประเมินเครือข่ายการอนุมานเอกสารทุก
ในคอลเลกชัน แต่เช่นเดียวกับวิธีการจัดอันดับอื่น ๆ ทุกดัชนีจะใช้ในการ
เพิ่มความเร็วในการคำนวณ โดยทั่วไปโหนดเป็นตัวแทนการจัดทำดัชนีในขณะที่
โหนดแบบสอบถามที่ระบุไว้ในแต่ละแบบสอบถามโดยผู้ใช้หรือการค้นหาแอพลิเคชัน นี้
หมายความว่าดัชนีสำหรับความหลากหลายของคุณสมบัติความใกล้ชิดนอกเหนือไปจากคำพูดจะถูก
สร้างขึ้น (ตามที่อธิบายในบทที่ 5) อย่างมีนัยสำคัญการขยายขนาดของดัชนีได้.
ในการใช้งานบางอย่างที่น่าจะเป็นที่เกี่ยวข้องกับคุณสมบัติที่ใกล้ชิดจะคำนวณ
ในเวลาแบบสอบถาม เพื่อให้มีความยืดหยุ่นมากขึ้นในการระบุคำสั่ง

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

นอกเหนือไปจากคุณสมบัติตามคำที่เกิดขึ้น , รีโหนดยังแสดงถึงคุณลักษณะของความใกล้ชิด คุณสมบัติใกล้เคียงใช้เวลาหลายแตกต่างกันรูปแบบ เช่น ใช้คำพูด Co เกิดขึ้นภายในบาง " หน้าต่าง " ( ความยาว )ของข้อความและจะอธิบายในรายละเอียดในส่วนถัดไป คุณสมบัติที่ไม่ขึ้นอยู่กับรุ่นภาษา เช่นวันที่เอกสาร จะได้รับอนุญาต แต่ไม่แสดงในตัวอย่างนี้แบบสอบถาม , ฉี จะใช้หลักฐานจากการรวมโหนดสอบถาม และ โหนดอื่น ๆ โหนดเหล่านี้แสดงถึงการเกิดของหลักฐานที่ซับซ้อนมากขึ้นและคุณสมบัติของเอกสาร จำนวนของรูปแบบของการรวมกันอยู่ด้วยตรรกะ และหรือเป็นสองส่วนที่ง่ายที่สุด เครือข่ายโดยรวม. P ( ผม | D μ ) ซึ่งมีความเป็นไปได้ว่าข้อมูลต้องตรงกับได้รับเอกสารและพารามิเตอร์μ . ข้อมูลที่ต้องโหนฉันเป็นพิเศษโหนดแบบสอบถามที่รวมทั้งหมดของหลักฐานจากโหนดอื่น ๆแบบสอบถามในน่าจะเป็นคนเดียวหรือคะแนนความเชื่อ คะแนนนี้จะใช้ในการจัดอันดับเอกสาร แนวคิดนี้หมายความว่า เราต้องประเมินเครือข่ายการอนุมานสำหรับทุกเอกสารในคอลเลกชัน แต่เป็นกับทุกขั้นตอนวิธีการจัดอันดับอื่นๆ ดัชนี ใช้เพิ่มความเร็วในการคำนวณได้ โดยทั่วไปการจัดทำดัชนีโหนด ในขณะที่โหนดที่ระบุสำหรับแต่ละแบบสอบถามแบบสอบถามโดยผู้ใช้หรือโปรแกรมประยุกต์การค้นหา นี้หมายความว่าดัชนีความหลากหลายของคุณสมบัติ เช่น นอกจากคำ จะสร้าง ( ตามที่อธิบายไว้ในบทที่ 5 ) อย่างมีนัยสำคัญทางสถิติ การขยายขนาดของดัชนีในบางโปรแกรมที่น่าจะเกี่ยวข้องกับคุณลักษณะชั้นใกล้กับที่ค้นหาเวลาเพื่อให้ความยืดหยุ่นมากขึ้นในการค้นหาด้วย

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.