Conjunctive processingThe simplest

Conjunctive processing
The simplest kind of query optimization is conjunctive processing. By conjunctive
processing, we just mean that every document returned to the user needs to contain all of the query terms. Conjunctive processing is the default mode for many
web search engines, in part because of speed and in part because users have come to
expect it. With short queries, conjunctive processing can actually improve effectiveness and efficiency simultaneously. In contrast, search engines that use longer
queries, such as entire paragraphs, will not be good candidates for conjunctive
processing.
Conjunctive processing works best when one of the query terms is rare, as in
the query “fish locomotion”. The word “fish” occurs about 100 times as often as
the word “locomotion”. Since we are only interested in documents that contain
both words, the system can skip over most of the inverted list for “fish” in order
to find only the postings in documents that also contain the word “locomotion”.
Conjunctive processing can be employed with both term-at-a-time and document-at-a-time systems. Figure 5.20 shows the updated term-at-a-time algorithm
for conjunctive processing. When processing the first term, (i = 0), processing
proceeds normally. However, for the remaining terms, (i > 0), the algorithm
processes postings starting at line ??. It checks the accumulator table for the next
document that contains all of the previous query terms, and instructs list l
i
to
skip forward to that document if there is a posting for it (line ??). If there is a
posting, the accumulator is updated. Ifthe posting does not exist, the accumulator
is deleted (line ??).
The document-at-a-time version (Figure 5.21) is similar to the old documentat-a-time version, except in the inner loop. It begins by finding the largest document d currently pointed to by an inverted list (line 13). This document d is not
guaranteed to contain all the query terms, but it is a reasonable candidate. The
next loop tries to skip all lists forward to point at d (line 16). If this is not successful, the loop terminates and another document d is chosen. If it is successful, the
document is scored and added to the priority queue.
In both algorithms, the system runs fastest when the first list (l
0
) is the shortest
and the last list (ln) is the longest. This results in the biggest possible skip distances
in the last list, which is where skipping will help most.

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

ประมวลผล conjunctiveชนิดที่ง่ายที่สุดของการเพิ่มประสิทธิภาพแบบสอบถามเป็น conjunctive การประมวลผล โดย conjunctiveการประมวลผล เราเพียงแค่หมายถึง ว่า เอกสารทุกฉบับที่ส่งคืนเพื่อความต้องการของผู้ใช้จะประกอบด้วยทั้งหมดในแบบสอบถาม Conjunctive เป็นโหมดเริ่มต้นสำหรับหลาย ๆ คนเว็บเครื่องมือค้นหา ส่วนหนึ่งเนื่อง จากความเร็ว และส่วนหนึ่งเนื่องจากผู้ใช้มาคาดหวังว่า กับแบบสอบถามสั้น conjunctive การประมวลผลจริงสามารถปรับปรุงประสิทธิภาพและประสิทธิผลไปพร้อม ๆ กัน คมชัด ค้นหาเครื่องยนต์ที่ใช้อีกต่อไปแบบสอบถาม เช่นทั้งย่อหน้า จะไม่ดีสำหรับ conjunctiveการประมวลผลประมวลผล conjunctive ได้ผลดีที่สุดเมื่อสอบถามเงื่อนไขอย่างใดอย่างหนึ่งเป็นสิ่งที่หายาก ในการสอบถาม "ปลาซ้าย" คำว่า "ปลา" เกิดขึ้นประมาณ 100 เท่าได้บ่อยคำว่า "ซ้าย" เนื่องจากเราสนใจเฉพาะในเอกสารที่ประกอบด้วยทั้งสองคำ ระบบสามารถข้ามผ่านรายการคว่ำ "fish" ตามลำดับหาการลงรายการในเอกสารที่ประกอบด้วยคำว่า "ซ้าย"Conjunctive การประมวลผลสามารถนำมาใช้กับระบบที่ระยะเวลาเวลา และเอกสารที่เวลา รูปที่ 5.20 แสดงขั้นตอนวิธีการระยะเวลาเวลาปรับปรุงสำหรับการประมวลผล conjunctive เมื่อประมวลผลระยะแรก, (ผม = 0), ประมวลผลเงินสดรับโดยปกติ อย่างไรก็ตาม สำหรับเงื่อนไขที่เหลือ, (ฉัน > 0), อัลกอริทึมกระบวนการเริ่มต้นที่บรรทัดการลงรายการบัญชี ตรวจสอบตารางสะสมสำหรับถัดไปเอกสารที่ประกอบด้วยคำถามก่อนหน้านี้ทั้งหมด และแนะนำรายการ lผมถึงข้ามไปข้างหน้ากับเอกสารนั้นหากมีการลงรายการบัญชีสำหรับมัน (สาย??) ถ้ามีการลงรายการบัญชี ชื้นมีการปรับปรุง ลงรายการบัญชีถ้าไม่มีอยู่ ชื้นเป็นลบ (สาย??)เอกสารที่เวลารุ่น (รูป 5.21) จะคล้ายกับรุ่น documentat แบบที่เวลาเก่า ยกเว้นในวงภายใน เริ่ม โดยการหาเอกสาร d ที่ใหญ่ที่สุดในขณะนี้ชี้ไปตามรายการที่คว่ำ (สาย 13) D เอกสารนี้ไม่ได้รับประกันว่า จะประกอบด้วยเงื่อนไขแบบสอบถามทั้งหมด แต่มันเป็นผู้สมัครที่เหมาะสม การวนถัดไปพยายามที่จะข้ามรายการทั้งหมดไปข้างหน้าไปที่จุด d (บรรทัด 16) ถ้าไม่ประสบความสำเร็จ สิ้นสุดการวนรอบ และเลือก d เอกสารอื่น หากสำเร็จ การเอกสารเป็นประตู และเพิ่มลงในคิวลำดับความสำคัญในทั้งสองอัลกอริทึม ระบบการทำงานที่เร็วที่สุดเมื่อแรกรายการ (l0) เป็นเวลาอันสั้นและรายการสุดท้าย (ln) จะยาวที่สุด ผลระยะทางข้ามเป็นไปได้ที่ใหญ่ที่สุดในรายการครั้งสุดท้าย ซึ่งเป็นที่ข้ามจะช่วยให้มากที่สุด

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

เชื่อมต่อการประมวลผล
ชนิดที่ง่ายที่สุดของการเพิ่มประสิทธิภาพการค้นหาการประมวลผลที่เชื่อมต่อกัน โดยการเชื่อมต่อ
การประมวลผลเราก็หมายความว่าเอกสารทุกกลับไปที่ผู้ใช้ต้องการที่จะมีทุกคำแบบสอบถาม การประมวลผลที่เชื่อมต่อกันเป็นโหมดเริ่มต้นหลาย
เครื่องมือค้นหาเว็บส่วนหนึ่งเป็นเพราะความเร็วและส่วนหนึ่งเป็นเพราะผู้ใช้มีมา
คาดว่า ด้วยคำสั่งสั้น ๆ การประมวลผลที่เชื่อมต่อกันจริงสามารถปรับปรุงประสิทธิภาพและประสิทธิผลพร้อมกัน ในทางตรงกันข้ามเครื่องมือค้นหาที่ใช้อีกต่อไป
คำสั่งเช่นย่อหน้าทั้งหมดจะไม่เป็นผู้สมัครที่ดีสำหรับการเชื่อมต่อ
การประมวลผล.
การประมวลผลเยื่อตาทำงานได้ดีที่สุดเมื่อหนึ่งในแง่แบบสอบถามเป็นของหายากในขณะที่
การค้นหา "ปลาเคลื่อนที่" คำว่า "ปลา" เกิดขึ้นประมาณ 100 ครั้งได้บ่อยเท่าที่
คำว่า "การเคลื่อนไหว" เนื่องจากเรามีความสนใจเฉพาะในเอกสารที่มี
คำทั้งระบบสามารถข้ามมากที่สุดของรายการคว่ำสำหรับ "ปลา" เพื่อ
ที่จะหาเพียงโพสต์ในเอกสารที่ยังมีคำว่า "การเคลื่อนไหว" ได้.
ประมวลผลเยื่อตาสามารถทำงานกับ ทั้งในระยะ-at-เวลาและเอกสารที่เป็นช่วงเวลาที่ระบบ รูปที่ 5.20 แสดงให้เห็นถึงขั้นตอนวิธีการระยะเวลาที่เป็นช่วงเวลาที่มีการปรับปรุง
สำหรับการประมวลผลที่เชื่อมต่อกัน เมื่อการประมวลผลในระยะแรก (i = 0), การประมวลผล
การดำเนินการตามปกติ แต่สำหรับระยะเวลาที่เหลือ (i> 0), ขั้นตอนวิธี
การโพสต์กระบวนการเริ่มต้นที่เส้น ?? มันจะตรวจสอบตารางสะสมสำหรับถัดไป
เอกสารที่มีทั้งหมดของคำค้นหาก่อนหน้านี้และสั่ง L รายการ
ฉัน
จะ
ข้ามไปข้างหน้าในเอกสารว่าหากมีการโพสต์มัน (สาย ??) หากมี
การโพสต์สะสมที่มีการปรับปรุง ifthe โพสต์ไม่ได้อยู่สะสม
จะถูกลบ (สาย ??).
รุ่นเอกสารที่เวลา (รูปที่ 5.21) มีความคล้ายคลึงกับรุ่น documentat-เวลาเก่ายกเว้นในวงภายใน มันเริ่มต้นด้วยการหาเอกสารที่ใหญ่ที่สุด d ชี้ปัจจุบันโดยรายการ Inverted (สาย 13) เอกสาร D นี้ไม่ได้
รับประกันว่าจะมีทุกคำค้นหา แต่ก็เป็นผู้สมัครที่เหมาะสม
ห่วงต่อไปพยายามที่จะข้ามรายการทั้งหมดไปสู่จุดที่ D (สาย 16) หากไม่ประสบความสำเร็จในวงยุติการทำงานและเอกสารอื่น D ได้รับการแต่งตั้ง ถ้ามันจะประสบความสำเร็จ
เอกสารคะแนนและเพิ่มลงในคิวลำดับความสำคัญ.
ในขั้นตอนวิธีการทั้งสองระบบทำงานเร็วที่สุดเมื่อรายการแรก (L
0
) เป็นระยะเวลาที่สั้น
และรายการสุดท้าย (LN) เป็นที่ยาวที่สุด ซึ่งจะส่งผลในระยะทางที่ใหญ่ที่สุดเฮี๊ยบที่เป็นไปได้
ในรายการที่ผ่านมาซึ่งเป็นที่ที่จะช่วยให้การกระโดดข้ามมากที่สุด

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

การประมวลผลที่เชื่อมต่อกันชนิดที่ง่ายที่สุดของการเพิ่มประสิทธิภาพของกระบวนการที่เชื่อมต่อกัน ที่เชื่อมต่อกันโดยการประมวลผล เราหมายถึงทุกเอกสารที่ส่งกลับไปยังผู้ใช้ต้องการที่จะมีทั้งหมดของคำถามเงื่อนไข การประมวลผลที่เชื่อมต่อกันเป็นโหมดเริ่มต้นสำหรับหลายเครื่องมือค้นหาเว็บ ส่วนหนึ่งเป็นเพราะของความเร็วและในส่วนหนึ่งเนื่องจากผู้ใช้ได้มาคาดว่า กับสั้นแบบสอบถาม ประมวลผลการจริงสามารถปรับปรุงประสิทธิผลและประสิทธิภาพพร้อมกัน ในทางตรงกันข้าม เครื่องมือค้นหาที่จะใช้อีกต่อไปแบบสอบถาม เช่น ย่อหน้า จะไม่ได้เป็นผู้สมัครที่ดีสำหรับการการประมวลผลการประมวลผลการทำงานที่ดีที่สุดเมื่อหนึ่งในแบบสอบถามเงื่อนไขที่หายาก เช่นสอบถามปลา " การเคลื่อนที่ " คำว่า " ปลา " เกิดขึ้นเป็น 100 ครั้งแล้ว เป็นบ่อยๆคำว่า " การเคลื่อนที่ " ในเมื่อเราสนใจเฉพาะเอกสารที่ประกอบด้วยทั้งสองคำ ระบบสามารถข้ามมากที่สุดกลับรายการสำหรับ " ปลา " เพื่อเพื่อค้นหาเฉพาะการโพสต์ในเอกสารที่มีคำว่า " การเคลื่อนที่ " ยังการประมวลผลการสามารถใช้กับทั้ง term-at-a-time และระบบ document-at-a-time . รูปแสดงการปรับปรุงขั้นตอนวิธี term-at-a-time 5.20สำหรับการประมวลผลที่เชื่อมต่อกัน เมื่อการประมวลผลในระยะแรก ( = 0 = ) , การประมวลผลรายได้ปกติ อย่างไรก็ตาม สำหรับระยะเวลาที่เหลือ ( > 0 ) , ขั้นตอนวิธีกระบวนการการเริ่มต้นที่บรรทัด ? มันตรวจสอบตารางสะสมสำหรับถัดไปเอกสารที่ประกอบด้วยเงื่อนไขทั้งหมดแบบสอบถามก่อน และสั่งให้รายการล.ฉันเพื่อข้ามไปที่เอกสารนั้นหากมีการโพสต์มัน ( เส้น ? ? ) ถ้ามีการสะสม , การปรับปรุง ถ้าโพสต์ไม่ได้อยู่สะสมจะถูกลบ บรรทัด ? )การ document-at-a-time รุ่น ( รูปที่ 5.21 ) คล้ายกับรุ่น documentat-a-time เก่า นอกจากวงภายใน มันเริ่มต้นด้วยการหาเอกสาร D ที่ใหญ่ที่สุดในปัจจุบันที่ชี้โดยการคว่ำรายการ ( บรรทัดที่ 13 ) เอกสารนี้เป็นไม่รับประกันมีเงื่อนไขทั้งหมดแบบสอบถาม แต่เป็นผู้สมัครที่เหมาะสม ที่ต่อไปวงพยายามที่จะข้ามทั้งหมดรายการส่งต่อไปยังจุดที่ D ( สาย 16 ) ถ้ามันไม่ประสบความสำเร็จ ลูปสิ้นสุดลงและอีกเอกสาร ดี เลือก ถ้ามันประสบความสำเร็จเอกสารได้ และเพิ่มความสำคัญของคิวทั้งแบบระบบวิ่งเร็วที่สุดเมื่อรายการแรก ( ล.0) ที่สั้นที่สุดและรายการสุดท้าย ( LN ) อยู่ได้นานที่สุด ผลนี้ในที่ใหญ่ที่สุดที่เป็นไปได้ข้ามระยะทางในรายการสุดท้าย ซึ่ง เป็น ที่ ข้าม จะช่วยให้มากที่สุด

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.