The approach to web search describe

The approach to web search described in section 7.5, which scores documents
based on a combination or mixture of language models representing different
parts of the document structure, is based on Ogilvie and Callan (2003). The
BM25F ranking function (Robertson et al., 2004) is an extension of BM25 that is
also designed to effectively combine information from different document fields.
Spam is of such importance in web search that an entire subfield, called adversarial
information retrieval, has developed to deal with search techniques for
document collections that are being manipulated by parties with different interests
(such as spammers and search engine optimizers). We discuss the topic of
spam in Chapter 9.
The early work on learning ranking functions includes the use of logistic regression
(Cooper et al., 1992). Fuhr and Buckley (1991) were the first to describe
clearly how using features that are independent of the actual query words
(e.g., using a feature like the number of matching terms rather than which terms
matched) enable the learning of ranking functions across queries. The use of
Ranking SVM for information retrieval was described by Joachims (2002b). Cao
et al. (2006) describe modifications of this approach that improve ranking effectiveness.
RankNet (C. Burges et al., 2005) is a neural network approach to learning
a ranking function that is used in the Microsoft web search engine. Agichtein,
Brill, and Dumais (2006) describe how user behavior features can be incorporated
effectively into ranking based on RankNet. Both Ranking SVMs and RankNet
learn using partial rank information (i.e., pairwise preferences). Another class of
learning models, called listwise models, use the entire ranked list for learning. Examples
of these models include the linear discriminative model proposed by Gao
et al. (2005), which learns weights for features that are based on language models.
This approach has some similarities to the inference network model being used
to combine language model and other features. Another listwise approach is the term dependence model proposed by Metzler and Croft (2005b), which is also
based on a linear combination of features. Both the Gao and Metzler models provide
a learning technique that maximizes average precision (an important infor mation retrieval metric) directly. More information about listwise learning models
can be found in Xia et al. (2008).
Hofmann (1999) described a probabilistic version of LSI (pLSI) that introduced
the modeling of documents as a mixture of topics. The LDA model was
described by Blei et al. (2003). A number of extensions of this model have been
proposed since then, but they have not been applied to information retrieval.
The application of LDA to information retrieval was described in Wei and Croft(2006).

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

วิธีการค้นหาเว็บอธิบายไว้ในส่วน 7.5 ซึ่งคะแนนเอกสารผสมหรือส่วนผสมของรูปแบบภาษาที่แสดงแตกต่างกันส่วนของโครงสร้างของเอกสาร ตาม Ogilvie และ Callan (2003) การฟังก์ชันการจัดอันดับ BM25F (โรเบิร์ต et al. 2004) เป็นส่วนขยายของ BM25 ที่นอกจากนี้ยัง ออกแบบมาเพื่อรวมข้อมูลจากเขตข้อมูลเอกสารต่าง ๆ ได้อย่างมีประสิทธิภาพสแปมเป็นสำคัญเช่นในการค้นหาเว็บที่มีฟิลด์ย่อยทั้งหมด เรียกว่าแข่งขันมีพัฒนาที่เรียกข้อมูล การจัดการกับเทคนิคการค้นหาสำหรับคอลเลกชันเอกสารที่จะถูกจัดการ โดยบุคคลที่มีความสนใจที่แตกต่างกัน(เช่นสแปมเมอร์และเพิ่มประสิทธิภาพกลไกค้นหา) เราพูดคุยเรื่องสแปมในบทที่ 9การทำงานก่อนการเรียนรู้ฟังก์ชันการจัดอันดับรวมถึงการใช้การถดถอยโลจิสติก(คูเปอร์ et al. 1992) Buckley (1991) และ Fuhr คนแรกเพื่ออธิบายชัดเจนวิธีการใช้คุณลักษณะที่เป็นอิสระจากคำถามจริง(เช่น งานเช่นจำนวนจับคู่เงื่อนไขมากกว่าเงื่อนไขใดเปิดตรงกัน) ได้เรียนรู้จากการจัดอันดับของฟังก์ชันในแบบสอบถาม การใช้งานจัดอันดับ SVM สำหรับการดึงข้อมูลก็อธิบาย โดย Joachims (2002b) Caoet al. (2006) อธิบายถึงการปรับเปลี่ยนของวิธีการนี้ที่ปรับปรุงการจัดอันดับประสิทธิภาพRankNet (C. Burges et al. 2005) เป็นการเรียนรู้วิธีโครงข่ายประสาทฟังก์ชันการจัดลำดับที่ใช้ในโปรแกรม Microsoft เว็บค้นหา Agichteinสุดยอด และ Dumais (2006) อธิบายว่า คุณลักษณะของพฤติกรรมผู้ใช้สามารถติดตั้งได้อย่างมีประสิทธิภาพเป็นอันดับอิง RankNet จัดอันดับ SVMs และ RankNetเรียนรู้โดยใช้ข้อมูลอันดับบางส่วน (เช่น แพร์ไวส์การตั้งค่า) อีกหนึ่งระดับของรูปแบบการเรียนรู้ เรียกว่ารุ่น listwise ใช้รายการอันดับทั้งหมดสำหรับการเรียนรู้ ตัวอย่างของโมเดลเหล่านี้รวมถึงรุ่นของ discriminative เส้นที่เสนอ โดย Gaoet al. (2005), ซึ่งเรียนรู้น้ำหนักสำหรับคุณสมบัติที่ขึ้นอยู่กับรุ่นภาษาวิธีการนี้มีความคล้ายคลึงบางแบบเครือข่ายอ้างอิงถูกใช้การรวมรุ่นภาษาและคุณสมบัติอื่น ๆ วิธี listwise อื่นเป็นคำแบบพึ่งพาที่เสนอ โดย Metzler และ Croft (2005b), ซึ่งเป็นคะแนนจากการรวมเชิงเส้นของ ทั้งเกาและ Metzler รุ่นเทคนิคการเรียนรู้ที่เพิ่มความแม่นยำเฉลี่ย (สำคัญคือไดรเวอร์เรียกวัด) โดยตรง ข้อมูลเพิ่มเติมเกี่ยวกับการเรียนรู้แบบ listwiseสามารถพบได้ในเซี่ย et al. (2008)น่าจะรุ่นของ LSI (pLSI) ที่นำมาใช้อธิบาย Hofmann (1999)แบบจำลองของเอกสารเป็นส่วนผสมของหัวข้อ แก้ไขแบบ LDAอธิบายโดย Blei et al. (2003) จำนวนของส่วนขยายของรูปแบบนี้ได้เสนอตั้งแต่นั้น แต่พวกเขาไม่ได้ใช้ต้องการเรียกข้อมูลโปรแกรมประยุกต์ของ LDA เรียกข้อมูลถูกอธิบายไว้ในเว่ยและ Croft(2006)

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

วิธีการค้นหาเว็บอธิบายไว้ในส่วน 7.5 ซึ่งเอกสารคะแนน
ขึ้นอยู่กับการรวมกันหรือส่วนผสมของรุ่นภาษาที่แตกต่างกันที่เป็นตัวแทนของ
ส่วนของโครงสร้างของเอกสารที่อยู่บนพื้นฐานของโอกิลวีและ Callan (2003)
BM25F ฟังก์ชั่นการจัดอันดับ (โรเบิร์ต et al., 2004) เป็นส่วนขยายของ BM25 ที่ถูก
ออกแบบมาให้มีประสิทธิภาพการรวมข้อมูลจากเขตข้อมูลเอกสารที่แตกต่างกัน.
สแปมมีความสำคัญดังกล่าวในการค้นหาเว็บที่ฟิลด์ทั้งหมดเรียกว่าขัดแย้ง
ดึงข้อมูลได้มีการพัฒนา ที่จะจัดการกับเทคนิคการค้นหาสำหรับ
คอลเลกชันเอกสารที่มีการจัดการโดยบุคคลที่มีความสนใจที่แตกต่างกัน
(เช่นส่งอีเมลขยะและเพิ่มประสิทธิภาพเครื่องมือค้นหา) เราหารือหัวข้อของ
อีเมลขยะในบทที่ 9
การทำงานในช่วงต้นของการเรียนรู้ฟังก์ชั่นการจัดอันดับรวมถึงการใช้การถดถอยโลจิสติก
(Cooper et al., 1992) Fuhr และบัคลี่ย์ (1991) เป็นคนแรกที่อธิบาย
ได้อย่างชัดเจนว่าการใช้คุณสมบัติที่มีความเป็นอิสระของคำที่ใช้ค้นหาที่เกิดขึ้นจริง
(เช่นการใช้คุณลักษณะเช่นจำนวนของการจับคู่แง่มากกว่าซึ่งข้อตกลง
จับคู่) ช่วยให้การเรียนรู้ฟังก์ชั่นของการจัดอันดับทั่วแบบสอบถาม การใช้งานของ
การจัดอันดับ SVM สำหรับการดึงข้อมูลที่ถูกอธิบายโดย Joachims (2002b) เฉา
et al, (2006) อธิบายการปรับเปลี่ยนของวิธีการนี้ว่าปรับปรุงการจัดอันดับประสิทธิภาพ.
RankNet ( C. Burges et al., 2005) เป็นวิธีการที่เครือข่ายประสาทเพื่อการเรียนรู้
ฟังก์ชั่นการจัดอันดับที่ใช้ใน Web search engine ของไมโครซอฟท์ Agichtein,
สุดยอดและ Dumais (2006) อธิบายวิธีคุณลักษณะพฤติกรรมของผู้ใช้สามารถรวม
อย่างมีประสิทธิภาพในการจัดอันดับขึ้นอยู่กับ RankNet ทั้งสอง SVMs การจัดอันดับและ RankNet
เรียนรู้การใช้ข้อมูลบางส่วนอันดับ (เช่นการตั้งค่าคู่) ชั้นอีกประการหนึ่งของ
โมเดลการเรียนรู้ที่เรียกว่ารุ่น listwise ให้ใช้ทั้งการจัดอันดับรายการสำหรับการเรียนรู้ ตัวอย่าง
ของแบบจำลองเหล่านี้รวมถึงรูปแบบการจำแนกเชิงเส้นที่เสนอโดย Gao
, et al (2005) ซึ่งเรียนรู้น้ำหนักสำหรับคุณสมบัติที่เป็นไปตามรูปแบบภาษา.
วิธีการนี้มีลักษณะคล้ายคลึงกับรูปแบบเครือข่ายการอนุมานถูกนำมาใช้
ในการรวมรูปแบบภาษาและคุณสมบัติอื่น ๆ วิธี listwise ก็คือรูปแบบการพึ่งพาอาศัยกันในระยะที่เสนอโดย Metzler และ Croft (2005b) ซึ่งยัง
อยู่บนพื้นฐานของการรวมกันของคุณสมบัติเชิงเส้น ทั้ง Gao และ Metzler รุ่นให้
เทคนิคการเรียนรู้ที่ช่วยเพิ่มความแม่นยำเฉลี่ย (ที่มีความสำคัญ Infor mation ดึงตัวชี้วัด) โดยตรง ข้อมูลเพิ่มเติมเกี่ยวกับโมเดลการเรียนรู้ listwise
สามารถพบได้ในเซี่ย, et al (2008).
Hofmann (1999) อธิบายรุ่นน่าจะเป็นของ LSI (pLSI) แนะนำว่า
การสร้างแบบจำลองของเอกสารที่เป็นส่วนผสมของหัวข้อ รุ่น LDA ถูก
อธิบายโดย Blei et al, (2003) จำนวนของนามสกุลของรุ่นนี้ได้รับการ
เสนอตั้งแต่นั้นมา แต่พวกเขาไม่ได้ถูกนำมาใช้ในการดึงข้อมูล.
การประยุกต์ใช้ LDA เพื่อดึงข้อมูลที่ได้อธิบายไว้ในเหว่ยและครอฟท์ (2006)

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

วิธีการค้นหาเว็บที่อธิบายไว้ในมาตรา 63 ซึ่งคะแนนของเอกสารขึ้นอยู่กับการรวมกันหรือมีส่วนผสมของแบบภาษาแสดงต่าง ๆชิ้นส่วนของโครงสร้างเอกสาร จาก โอกิลวี และภาษาอังกฤษ ( 2003 ) ที่การจัดอันดับ bm25f ฟังก์ชัน ( โรเบิร์ต et al . , 2004 ) เป็นส่วนขยายของ bm25 นั่นคือยังออกแบบให้มีประสิทธิภาพรวมข้อมูลจากเขตข้อมูลเอกสารต่าง ๆสแปมดังกล่าวมีความสำคัญในการค้นหาเว็บที่ subfield ขัดแย้งทั้งหมด เรียกว่าสืบค้นสารสนเทศ พัฒนา จัดการกับเทคนิคค้นหาเอกสารคอลเลกชันที่ถูกบงการโดยบุคคลที่มีความสนใจที่แตกต่างกัน( เช่นผู้ส่งอีเมลขยะและการค้นหาเครื่องยนต์ optimizers ) เราคุยกันเรื่องสแปมในบทที่ 9งานแรกในการเรียนรู้ รวมถึงการใช้ฟังก์ชันการถดถอยโลจิสติก( Cooper et al . , 1992 ) ฟุร์ และ บัคลี่ย์ ( 1991 ) เป็นคนแรกที่อธิบายว่า การใช้คุณลักษณะที่เป็นอิสระของคำที่ค้นหาจริง( เช่น การใช้คุณลักษณะเช่นจำนวนของเงื่อนไขที่ตรงกับเงื่อนไขมากกว่าจับคู่ ) ให้เรียนรู้การจัดอันดับฟังก์ชั่นในการสืบค้น ใช้ของการจัดอันดับ SVM สำหรับการสืบค้นข้อมูลได้รับการอธิบายโดย joachims ( 2002b ) โจโฉet al . ( 2006 ) อธิบายการวิธีการนี้ที่ปรับปรุงการจัดอันดับประสิทธิผลranknet ( C . เบิร์ก et al . , 2005 ) เป็นวิธีการที่เครือข่ายประสาทเพื่อการเรียนรู้เป็นฟังก์ชันที่ใช้ในการจัดอันดับของ Microsoft เครื่องมือค้นหาเว็บ . agichtein ,สุดยอด และ dumais ( 2006 ) อธิบายวิธีคุณลักษณะพฤติกรรมของผู้ใช้สามารถรวมมีประสิทธิภาพในการจัดอันดับตาม ranknet . การจัดอันดับ ranknet ทั้งสองแบบและเรียนรู้การใช้ข้อมูลตำแหน่งบางส่วน ( เช่น คู่ลักษณะ ) อีกระดับของรูปแบบการเรียนรู้ เรียกว่ารุ่น listwise ใช้ทั้งรายชื่อเพื่อการเรียนรู้ ตัวอย่างรุ่นนี้รวมถึงการเชิงเส้นและรูปแบบการนำเสนอโดยการเกาet al . ( 2005 ) ซึ่งเรียนรู้น้ำหนักคุณสมบัติที่ขึ้นอยู่กับรุ่นภาษาวิธีการนี้มีความคล้ายคลึงกับการอนุมานแบบเครือข่ายที่มีการใช้รวมโมเดลภาษาและคุณสมบัติอื่น ๆ อีก listwise แนวทางระยะยาวแบบพึ่งพาเสนอโดยเม็ตสเลอร์และ Croft ( 2005b ) ซึ่งยังบนพื้นฐานของการรวมกันเชิงเส้นของคุณสมบัติ นางแบบทั้งเกา และเม็ตสเลอร์ ให้เทคนิคการเรียนรู้ที่เพิ่มความแม่นยำเฉลี่ย ( สำคัญมากสำหรับการดึงข้อมูลตัวชี้วัด ) โดยตรง ข้อมูลเพิ่มเติมเกี่ยวกับ listwise รูปแบบการเรียนรู้สามารถพบได้ใน Xia et al . ( 2008 )ฮอฟมานน์ ( 1999 ) อธิบายรุ่น 11 LSI ( plsi ) ที่แนะนำแม่แบบของเอกสารที่เป็นส่วนผสมของหัวข้อ การ lda แบบจำลองอธิบายโดย blei et al . ( 2003 ) หมายเลขของนามสกุลของรุ่นนี้ได้เสนอแล้ว แต่พวกเขายังไม่ได้ถูกใช้เพื่อการสืบค้นข้อมูลการประยุกต์ใช้ lda การสืบค้นข้อมูลได้อธิบายไว้ใน Wei และ Croft ( 2006 )

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.