One of the important issues in gene

One of the important issues in general information retrieval is vocabulary mismatch.
This refers to a situation where relevant documents do not match a query,
because they are using different words to describe the same topic. In the web environment,
many documents will contain all the query words, so this may not appear
to be an issue. In search applications with smaller collections, however, it will
be important, and even in web search, TREC experiments have shown that topical
queries produce better results using query expansion. Query expansion (using,
for example, pseudo-relevance feedback) is the standard technique for reducing
vocabulary mismatch, although stemming also addresses this issue to some extent.
A different approach would be to expand the documents by adding related terms.
For documents represented as language models, this is equivalent to smoothing
the probabilities in the language model so that words that did not occur in the
text have non-zero probabilities. Note that this is different from smoothing using
the collection probabilities, which are the same for all documents. Instead, we
need some way of increasing the probabilities of words that are associated with the topic of the document.

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

หนึ่งในปัญหาสำคัญในการดึงข้อมูลทั่วไปเป็นคำศัพท์ที่ไม่ตรงกันนี้หมายถึงสถานการณ์ที่เกี่ยวข้องเอกสารไม่ตรงกับแบบสอบถามเนื่องจากพวกเขากำลังใช้คำที่ต่างกันเพื่ออธิบายหัวข้อเดียวกัน เว็บสิ่งแวดล้อมหลายเอกสารจะประกอบด้วยคำทั้งหมดที่สอบถาม ดังนั้นนี้อาจไม่ปรากฏขึ้นจะ มีปัญหา ค้นหางานกับคอลเลกชันขนาดเล็ก อย่างไรก็ตาม มันจะมีความสำคัญ และแม้ในการค้นหาเว็บ TREC ทดลองได้แสดงให้เห็นว่าเฉพาะแบบสอบถามภาพที่ดีกว่าโดยใช้แบบสอบถามขยาย สอบถาม (การใช้ การขยายตัวอย่างเช่น ข้อเสนอแนะเกี่ยวหลอก) เป็นเทคนิคการลดมาตรฐานคำศัพท์ไม่ตรงกัน แม้ว่าเกิดยังเน้นปัญหานี้บ้างวิธีแตกต่างจะเป็นการ ขยายเอกสาร โดยการเพิ่มเงื่อนไขที่เกี่ยวข้องสำหรับเอกสารที่แสดงเป็นรูปแบบภาษา นี้จะเท่ากับการปรับให้เรียบน่าจะในรูปแบบภาษาเพื่อที่คำที่ยังไม่เกิดขึ้นในการข้อความได้น่าจะไม่ใช่ศูนย์ โปรดสังเกตว่า นี้แตกต่างจากการปรับใช้การเก็บรวบรวมน่าจะ ซึ่งเหมือนกันสำหรับเอกสารทั้งหมด แทน เราต้องบางวิธีเพิ่มน่าจะของคำที่เกี่ยวข้องกับหัวข้อของเอกสาร

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

หนึ่งในประเด็นสำคัญในการดึงข้อมูลทั่วไปคือไม่ตรงกันคำศัพท์.
นี้หมายถึงสถานการณ์ที่เอกสารที่เกี่ยวข้องไม่ตรงกับแบบสอบถามเป็น
เพราะพวกเขาจะใช้คำพูดที่แตกต่างกันเพื่ออธิบายหัวข้อเดียวกัน ในสภาพแวดล้อมเว็บ
เอกสารจำนวนมากจะมีทุกคำที่ใช้ค้นหาดังนั้นนี้อาจไม่ปรากฏ
เป็นปัญหา ในการใช้งานการค้นหาที่มีคอลเลกชันที่มีขนาดเล็ก แต่มันจะ
เป็นสิ่งที่สำคัญและแม้แต่ในการค้นหาเว็บทดลอง TREC ได้แสดงให้เห็นว่าเฉพาะ
คำสั่งให้ผลลัพธ์ที่ดีกว่าการใช้การขยายการค้นหา ขยายการค้นหา (ใช้
ตัวอย่างเช่นข้อเสนอแนะหลอกความสัมพันธ์กัน) เป็นเทคนิคมาตรฐานสำหรับการลด
ไม่ตรงกันคำศัพท์แม้จะเกิดยังอยู่ปัญหานี้ไปบ้าง.
วิธีการที่แตกต่างกันจะมีการขยายเอกสารโดยการเพิ่มคำที่เกี่ยวข้อง.
สำหรับเอกสารที่แสดงเป็น รุ่นภาษานี้จะเทียบเท่ากับการปรับให้เรียบ
ความน่าจะเป็นในรูปแบบภาษาเพื่อให้คำพูดที่ไม่ได้เกิดขึ้นใน
ข้อความที่มีความน่าจะเป็นที่ไม่ใช่ศูนย์ โปรดทราบว่านี้จะแตกต่างจากการปรับให้เรียบโดยใช้
ความน่าจะเป็นคอลเลกชันซึ่งจะเหมือนกันสำหรับเอกสารทั้งหมด แต่เรา
ต้องมีวิธีในการเพิ่มความน่าจะเป็นของคำที่เกี่ยวข้องกับหัวข้อของเอกสารบางอย่าง

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

หนึ่งในประเด็นที่สำคัญในการดึงข้อมูลทั่วไปจะไม่ตรงกัน คำศัพท์นี้หมายถึงสถานการณ์ที่เอกสารไม่ตรงกับที่สอบถามเพราะพวกเขามีการใช้คำที่แตกต่างกันเพื่อบรรยายในหัวข้อเดียวกัน ในเว็บสิ่งแวดล้อมเอกสารหลายคำทั้งหมดจะประกอบด้วยแบบสอบถาม ดังนั้นนี้อาจปรากฏขึ้นที่จะเป็นปัญหา ในการค้นหาที่มีคอลเลกชันที่มีขนาดเล็กลง แต่ก็จะเป็นสำคัญ และแม้แต่ในการค้นหาเว็บ trec การทดลองได้แสดงให้เห็นว่า ยาทาสอบถามการสร้างผลลัพธ์ที่ดีกว่าการใช้แบบสอบถาม การสืบค้นข้อมูล ( ใช้ตัวอย่างเช่น , หลอก , ความคิดเห็น ) เป็นเทคนิคมาตรฐานสำหรับลดศัพท์ไม่ตรงกัน แต่กั้นยังที่อยู่ปัญหานี้ได้บ้างวิธีการที่แตกต่างกันจะถูกขยายโดยการเพิ่มเอกสารที่เกี่ยวข้องกับเงื่อนไขสำหรับเอกสารที่แสดงเป็นรุ่นภาษา นี้จะเทียบเท่ากับปรับให้เรียบความน่าจะเป็นในโมเดลภาษา ดังนั้นคำพูดที่ไม่ได้เกิดขึ้นในข้อความที่ได้ผลรวมของค่าความน่าจะเป็น ทราบว่า นี้จะแตกต่างจากการปรับให้เรียบคอลเลกชันความน่าจะเป็น ซึ่งจะเหมือนกันสำหรับเอกสารทั้งหมด แทนเราอยากได้วิธีเพิ่มค่าความน่าจะเป็นของคำที่เกี่ยวข้องกับหัวข้อของเอกสาร

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.