Some of these steps require further

Some of these steps require further explanation. In steps 1 and 4, the document
language model probabilities (P(w|D)) should be estimated using Dirichlet
smoothing. In step 2, the model allows the set C to be the whole collection, but
because low-ranked documents have little effect on the estimation of P(w|R),
usually only 10–50 of the top-ranked documents are used. This also makes the
computation of P(w|R) substantially faster.
For similar reasons, the summation in step 4 is not done over all words in
the vocabulary. Typically only a small number (10–25) of the highest-probability
words are used. In addition, the importance of the original query words is emphasized by combining the original query frequency estimates with the relevance
model estimates using a similar approach to Jelinek-Mercer, i.e., λP(w|Q)+(1−
λ)P(w|R), where λ is a mixture parameter whose value is determined empirically
(0.5 is a typical value for TREC experiments). This combination makes it
clear that estimating relevance models is basically a process for query expansion
and smoothing. for relevance model estimation. In the second pass, we use KL-divergence to rank
documents by comparing the relevance model and the document model. Note
also that we are in effect adding words to the query by smoothing the relevance
model using documents that are similar to the query. Many words that had zero
probabilities in the relevance model based on query frequency estimates will now
have non-zero values. What we are describing here is exactly the pseudo-relevance
feedback process described in section 6.2.4. In other words, relevance models provide
a formal retrieval model for pseudo-relevance feedback and query expansion.

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

บางส่วนของขั้นตอนเหล่านี้ต้องเพิ่มเติมคำอธิบาย ในขั้นตอนที่ 1 และ 4 เอกสารน่าจะรุ่นภาษา (P(w| D)) ควรจะประเมินโดยใช้ Dirichletเรียบ ในขั้นตอนที่ 2 แบบให้ชุด C จะ เก็บทั้ง แต่เนื่องจากเอกสารจัดอันดับต่ำมีผลการประเมินของ P(w| เล็ก R)ปกติเพียง 10-50 ของเอกสารอันดับต้น ๆ ที่จะใช้ นี้ยังทำให้การการคำนวณ P(w| R) ได้รวดเร็วขึ้นเหตุผลที่คล้าย รวมในขั้นตอนที่ 4 ไม่ได้ทำผ่านคำทั้งหมดในคำศัพท์ โดยทั่วไปเพียงจำนวนน้อย (10 – 25) ที่สูงสุดน่าเป็นคำที่ใช้ นอกจากนี้ เน้นความสำคัญของคำถามเดิม โดยรวมประเมินความถี่ของแบบสอบถามต้นฉบับที่เกี่ยวข้องกับรูปแบบประเมินโดยใช้วิธีการคล้ายกับเมอร์เซอร์ Jelinek เช่น λP(w| Q) + (1−Λ) P(w| R) ที่λเป็นพารามิเตอร์ส่วนผสมที่มีค่าจะถูกกำหนดเชิงประสบการณ์ด้วย(0.5 เป็นค่าทั่วไปสำหรับการทดลอง TREC) ชุดนี้ทำให้ล้างประมาณรุ่นที่เกี่ยวข้องว่าโดยทั่วไปกระบวนการสำหรับแบบสอบถามขยายและปรับให้เรียบ สำหรับความเกี่ยวข้องแบบประเมิน ในรหัสผ่านสอง เราใช้ KL-เศรษฐกิจในการจัดอันดับเอกสาร โดยการเปรียบเทียบแบบจำลองเกี่ยวข้องและรูปแบบเอกสาร หมายเหตุยังว่า เราอยู่ในลักษณะการเพิ่มคำในแบบสอบถาม โดยปรับความเกี่ยวข้องรุ่นที่ใช้เอกสารที่คล้ายกับแบบสอบถาม คำจำนวนมากที่มีศูนย์น่าจะในรูปแบบความเกี่ยวข้องตามการประเมินแบบสอบถามความถี่จะตอนนี้มีค่าไม่เป็นศูนย์ สิ่งที่เราจะอธิบายต่อไปนี้เป็นความเกี่ยวข้องหลอกแน่นอนกระบวนการความคิดเห็นที่อธิบายไว้ในส่วน 6.2.4 ในคำอื่น ๆ รุ่นที่เกี่ยวข้องให้แบบจำลองทางการเรียกสำหรับการขยายความคิดเห็นและสอบถามเกี่ยวหลอก

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

บางส่วนของขั้นตอนเหล่านี้จำเป็นต้องมีคำอธิบายเพิ่มเติม ในขั้นตอนที่ 1 และ 4 เอกสาร
น่าจะเป็นรูปแบบภาษา (P (W | D)) ควรจะใช้ประมาณ Dirichlet
เรียบ ในขั้นตอนที่ 2 รูปแบบช่วยให้ชุด C จะเป็นคอลเลกชันทั้งหมด แต่
เนื่องจากเอกสารการจัดอันดับต่ำมีผลเพียงเล็กน้อยต่อการประมาณค่าของ P (w | R) ซึ่ง
มักจะมีเพียง 10-50 ของเอกสารติดอันดับถูกนำมาใช้ นอกจากนี้ยังทำให้
การคำนวณ P (W | R) อย่างมีนัยสำคัญได้เร็วขึ้น.
ด้วยเหตุผลที่คล้ายกันบวกในขั้นตอนที่ 4 ไม่ได้ทำมากกว่าทุกคำใน
คำศัพท์ โดยปกติมีเพียงจำนวนน้อย (10-25) ที่สูงที่สุดน่าจะเป็น
คำที่ถูกนำมาใช้ นอกจากนี้ความสำคัญของคำที่ใช้ค้นหาเดิมจะเน้นโดยรวมประมาณการความถี่แบบสอบถามเดิมที่มีความสัมพันธ์กัน
ประมาณการรูปแบบโดยใช้วิธีการคล้ายกับ Jelinek-เมอร์เซอร์ IE, λP (w | Q) + (1-
λ) P (W | R) ที่λเป็นพารามิเตอร์ที่ส่วนผสมที่มีค่าจะถูกกำหนดสังเกตุ
(0.5 เป็นค่าปกติสำหรับการทดลอง TREC) การรวมกันนี้จะทำให้มัน
ชัดเจนว่าการประเมินแบบจำลองความสัมพันธ์กันเป็นพื้นกระบวนการในการขยายการค้นหา
และเรียบ สำหรับการประมาณรูปแบบความสัมพันธ์กัน ในรหัสผ่านที่สองเราจะใช้ KL-ความแตกต่างในการจัดอันดับ
เอกสารโดยการเปรียบเทียบรูปแบบความสัมพันธ์กันและรูปแบบเอกสาร หมายเหตุ
ยังที่เราจะมีผลเพิ่มคำในแบบสอบถามโดยการปรับให้เรียบความเกี่ยวข้อง
รูปแบบโดยใช้เอกสารที่มีความคล้ายคลึงกับแบบสอบถาม หลายคำที่มีศูนย์
ความน่าจะเป็นในรูปแบบความสัมพันธ์กันขึ้นอยู่กับการประมาณการความถี่แบบสอบถามในขณะนี้จะ
มีค่าที่ไม่ใช่ศูนย์ สิ่งที่เราจะอธิบายที่นี่เป็นสิ่งหลอกความเกี่ยวข้อง
กระบวนการข้อเสนอแนะที่อธิบายไว้ในส่วน 6.2.4 ในคำอื่น ๆ รุ่นความสัมพันธ์กันให้
เป็นรูปแบบการเรียกอย่างเป็นทางการสำหรับข้อเสนอแนะหลอกเกี่ยวข้องและการขยายการค้นหา

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

บางส่วนของขั้นตอนเหล่านี้ต้องอธิบายเพิ่มเติม ในขั้นตอนที่ 1 และ 4 , เอกสารความน่าจะเป็นแบบจำลองภาษา ( P ( W | D ) ควรถูกประเมินโดยใช้ดีริชเลต์เรียบ . ในขั้นตอนที่ 2 รูปแบบ ช่วยให้ชุด C เป็นคอลเลกชันทั้งหมด แต่การจัดอันดับเอกสารน้อยเพราะจะมีผลเพียงเล็กน้อยในการประมาณค่าของ p ( W | R )มักจะมีเพียง 10 - 50 ของอันดับยอดเอกสาร ที่ใช้ นี้ยังทำให้การคำนวณของ P ( W | R ) เร็วขึ้นอย่างมาก .สำหรับเหตุผลที่คล้ายกัน . ในขั้นตอนที่ 4 ไม่ได้ทำมากกว่าพูดในคําศัพท์ โดยทั่วไปเพียงจํานวนน้อย ( 10 – 25 ) ของความน่าจะเป็นสูงสุดคำที่ใช้ นอกจากนี้ ความสำคัญของคำถามเดิมคือเน้นโดยรวมประเมินแบบสอบถามความถี่เดิมที่มีความเกี่ยวข้องแบบประเมินการใช้คล้ายๆกับเธอ เมอร์เซอร์ ได้แก่ λ P ( W | Q ) + ( − 1λ ) P ( W | R ) ที่λเป็นส่วนผสมที่มีค่าพารามิเตอร์จะพิจารณาจากผล( 0.5 เป็นค่าปกติสำหรับ trec การทดลอง ) การรวมกันนี้จะทำให้มันชัดเจนว่า การประเมินแบบความเกี่ยวข้องโดยทั่วไปคือ กระบวนการสำหรับการขยายคำสั่งสอบถามและปรับให้เรียบ . การประมาณค่าแบบจำลองความเกี่ยวข้อง ในผ่านที่สอง เราใช้ KL ความแตกต่างอันดับเอกสารเปรียบเทียบความเกี่ยวข้องและรูปแบบเอกสารรูปแบบ หมายเหตุยังที่เราจะมีผลเพิ่มคําถาม โดย The เรียบรูปแบบการใช้เอกสารที่เป็นคล้ายกับการ หลายคำที่ศูนย์ความน่าจะเป็นในความสัมพันธ์แบบตามแบบสอบถามประเมินความถี่จะตอนนี้ต้องไม่เป็นค่า สิ่งที่เราจะอธิบายที่นี่ก็ความเกี่ยวข้องเทียมกระบวนการป้อนกลับที่อธิบายไว้ในส่วน 6.2.4 . ในคำอื่น ๆที่เกี่ยวข้องให้รุ่นรูปแบบทางการสืบค้นความคิดเห็นความเกี่ยวข้องเทียมและการสอบถาม

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.