Since I1 and I2may have used the sa

Since I1 and I2
may have used the same document numbers, the merge function
renumbers documents in I2.
This merging process can succeed even if there is only enough memory to store
two words (w1and w2), a single inverted list posting, and a few file pointers. In
practice, a real merge function would read large chunks of I1 and I2, and then
write large chunks to I in order to use the disk most efficiently.
This merging strategy also shows a possible parallel indexing strategy. If many
machines build their own partial indexes, a single machine can combine all of
those indexes together into a single, final index. However, in the next section,
we will explore more recent distributed indexing frameworks that are becoming
popular.
5.6.3 Parallelism and Distribution
The traditional model for search engines has been to use a single, fast machine to
create the index and process queries. This is still the appropriate choice for a large
number of applications, but it is no longer a good choice for the largest systems.
Instead, for these large systems, it is increasingly popular to use many inexpensive servers together and use distributed processing software to coordinate their
activities. MapReduce is a distributed processing tool that makes this possible.
Two factors have forced this shift. First, the amount of data to index in the
largest systems is exploding. Modern web search engines already index tens of billions of pages, but even larger indexes are coming. Consider that if each person on
earth wrote one blog post each day, the Web would increase in size by over two
trillion pages every year. Optimistically, one typical modern computer can handle
a few hundred million pages, although not with the kind of response times that

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

ตั้งแต่ I1 และ I2อาจใช้เลขเอกสารเดียวกัน การเวียนการกำหนดหมายเลขเอกสารใน I2กระบวนการผสานนี้สามารถประสบความสำเร็จแม้ว่าจะเพียงพอสำหรับการจัดเก็บคำสองคำ (w1and w2), เดียวกลับรายการลงรายการบัญชี และกี่ไฟล์ตัวชี้ ในปฏิบัติ ฟังก์ชันเวียนจริงจะอ่านชิ้นใหญ่ของ I1 และ I2 แล้วเขียนชิ้นใหญ่ไปเพื่อที่จะใช้ดิสก์มากที่สุดกลยุทธ์นี้ผสานแสดงดัชนีกลยุทธ์คู่ขนานไปด้วย ถ้าหลายเครื่องสร้างดัชนีบางส่วนตนเอง เครื่องเดียวรวมทั้งหมดของดัชนีที่โดดลงในดัชนีเดียว สุดท้าย อย่างไรก็ตาม ในส่วนเราจะสำรวจกรอบดัชนีกระจายล่าสุดที่จะกลายเป็นยอดนิยม5.6.3 ขนานและการกระจายได้รับแบบดั้งเดิมเครื่องมือค้นหาจะ ใช้เครื่องเดียว อย่างรวดเร็วสร้างแบบสอบถามดัชนีและกระบวนการ นี้ยังคงเป็นทางเลือกเหมาะสมสำหรับขนาดใหญ่จำนวนของโปรแกรมประยุกต์ แต่มันจะไม่เหมาะสำหรับระบบที่ใหญ่ที่สุดแทน สำหรับระบบขนาดใหญ่เหล่านี้ ก็นิยมการใช้เซิร์ฟเวอร์ไม่แพงมากด้วยกัน และใช้ซอฟต์แวร์แบบกระจายการประมวลผลประสานงานของพวกเขากิจกรรม MapReduce เป็นเครื่องมือกระจายการประมวลผลที่ทำให้นี้ได้ปัจจัยทั้งสองมีการบังคับให้เปลี่ยนแปลง ครั้งแรก จำนวนข้อมูลดัชนีในการระบบใหญ่ที่สุดเป็นระเบิด เครื่องมือค้นหาเว็บทันสมัยแล้วดัชนีหมื่นล้านหน้า แต่ดัชนีใหญ่กำลังมา พิจารณาว่าถ้าแต่ละคนในโลกเขียนบล็อกเดียวแต่ละวัน เว็บจะเพิ่มขนาด ด้วยกว่าสองล้านล้านหน้าทุกปี แง่ดี สามารถจัดการคอมพิวเตอร์ที่ทันสมัยทั่วไปหนึ่งไม่กี่ร้อยล้านหน้า แม้จะไม่ มีชนิดของการตอบสนองเท่าที่

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

ตั้งแต่ I1 และ I2
อาจมีการใช้เลขที่เอกสารเดียวกันฟังก์ชั่นการผสาน
การกำหนดหมายเลขเอกสารใน I2.
กระบวนการควบรวมนี้สามารถประสบความสำเร็จแม้ว่าจะมีเพียงหน่วยความจำเพียงพอที่จะเก็บ
คำสองคำ (w1and W2) เดียวโพสต์รายการคว่ำและไม่กี่ ตัวชี้ไฟล์ ใน
ทางปฏิบัติฟังก์ชั่นการผสานจริงจะอ่านชิ้นใหญ่ของ I1 และ I2 แล้ว
เขียนชิ้นใหญ่ให้กับผมในการที่จะใช้ดิสก์ได้อย่างมีประสิทธิภาพมากที่สุด.
กลยุทธ์การควบรวมนี้ยังแสดงให้เห็นถึงกลยุทธ์การจัดทำดัชนีที่เป็นไปได้ขนาน หากหลาย
เครื่องสร้างดัชนีบางส่วนของตัวเองเครื่องเดียวสามารถรวมทั้งหมดของ
ดัชนีเหล่านั้นเข้าด้วยกันเป็นหนึ่งเดียวดัชนีสุดท้าย อย่างไรก็ตามในส่วนถัดไป
เราจะสำรวจเมื่อเร็ว ๆ นี้การกระจายกรอบการจัดทำดัชนีที่จะกลายเป็น
ที่นิยม.
5.6.3 ขนานและการจัดจำหน่าย
รูปแบบดั้งเดิมสำหรับเครื่องมือค้นหาที่ได้รับที่จะใช้เพียงครั้งเดียว, เครื่องรวดเร็ว
สร้างดัชนีและกระบวนการคำสั่ง นี้ยังคงเป็นทางเลือกที่เหมาะสมสำหรับขนาดใหญ่
จำนวนการใช้งาน แต่ก็ไม่มีทางเลือกที่ดีสำหรับระบบที่ใหญ่ที่สุด.
แต่สำหรับระบบขนาดใหญ่เหล่านี้ก็เป็นที่นิยมมากขึ้นในการใช้เซิร์ฟเวอร์ที่ราคาไม่แพงจำนวนมากร่วมกันและใช้ซอฟต์แวร์ประมวลผลแบบกระจายในการประสานงาน ของพวกเขา
กิจกรรม MapReduce เป็นเครื่องมือประมวลผลแบบกระจายที่ทำให้เป็นไปได้นี้.
สองปัจจัยได้บังคับให้การเปลี่ยนแปลงนี้ ครั้งแรกจำนวนข้อมูลเพื่อจัดทำดัชนีใน
ระบบที่ใหญ่ที่สุดเป็นระเบิด เครื่องมือค้นหาเว็บสมัยใหม่แล้วนับดัชนีของพันล้านหน้า แต่ดัชนีได้ขนาดใหญ่ที่กำลังจะมา พิจารณาว่าถ้าแต่ละคนบน
แผ่นดินเขียนบล็อกโพสต์หนึ่งในแต่ละวันเว็บจะเพิ่มขึ้นในขนาดโดยกว่าสอง
ล้านล้านหน้าเป็นประจำทุกปี มองโลกในแง่หนึ่งคอมพิวเตอร์ที่ทันสมัยทั่วไปสามารถจัดการ
ไม่กี่ร้อยล้านหน้าแม้จะไม่ได้อยู่กับชนิดของเวลาการตอบสนองที่

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.