In this scheme, we process each posting ⌊T/n⌋ times because we touch it
during each of ⌊T/n⌋ merges where n is the size of the auxiliary index and T
the total number of postings. Thus, the overall time complexity is Q(T2/n).
(We neglect the representation of terms here and consider only the docIDs.
For the purpose of time complexity, a postings list is simply a list of docIDs.)
We can do better than Q(T2/n) by introducing log2(T/n) indexes I0, I1,
I2, . . . of size 20 × n, 21 × n, 22 × n . . . . Postings percolate up this sequence of
indexes and are processed only once on each level. This LOGARITHMIC scheme is called log-
MERGING arithmic merging (Figure 4.7). As before, up to n postings are accumulated in
an in-memory auxiliary index, which we call Z0. When the limit n is reached,
the 20 × n postings in Z0 are transferred to a new index I0 that is created on
disk. The next time Z0 is full, it is mergedwith I0 to create an index Z1 of size
21× n. Then Z1 is either stored as I1 (if there isn’t already an I1) or merged
with I1 into Z2 (if I1 exists); and so on. We service search requests by querying
in-memory Z0 and all currently valid indexes Ii on disk and merging the
results. Readers familiar with the binomial heap data structure2 will recog-
ในโครงการนี้เราแต่ละขั้นตอนการโพสต์⌊ T / N ⌋ครั้งเพราะเราสัมผัสมันได้ ในแต่ละช่วงของ⌊
T / N ⌋ผสานโดยที่ n คือขนาดของดัชนีเสริมและ t
จำนวนของป้าย ดังนั้นความซับซ้อนเวลาโดยรวม ( T2 Q / n )
( เราละเลยการเป็นตัวแทนของข้อตกลงนี้ และพิจารณาเฉพาะ docids .
เพื่อความซับซ้อน เวลา รายการการโพสต์ที่เป็นเพียงรายชื่อ docids
)เราสามารถทำได้ดีกว่า ( T2 Q / n ) โดยการแนะนำ LOG ( T / N ) ดัชนี . i1 I2
, , , , , , , , . . . . . . . . ขนาด 20 × N 21 × N 22 × N . . . . . . . . . โพสต์กรองขึ้นลำดับ
ดัชนีและประมวลผลเพียงครั้งเดียวในแต่ละระดับ นี้ลอการิทึมโครงการที่เรียกว่าล็อก -
ผสาน arithmic ผสาน ( รูปที่ 1 ) ก่อนถึง n ประกาศจะสะสมใน
ในหน่วยความจำเสริมดัชนี ซึ่งเราเรียก z0 .เมื่อขีด N ถึง
20 × N โพสต์ใน z0 จะส่งไปใหม่ดัชนี i0
ที่ถูกสร้างขึ้นบนดิสก์ คราวหน้า z0 เต็ม มันคือการสร้างดัชนี mergedwith i0 Z1
21 × N ขนาดนั้นก็เก็บไว้เป็น Z1 i0 ( ถ้าไม่มีก็ได้ ) หรือผสาน
กับ i0 ในกขึ้น ( ถ้าได้อยู่ ) ; และ บริการค้นหาข้อมูล
เราขอใน z0 หน่วยความจำและขณะนี้ถูกต้องดัชนี II บนดิสก์และการรวม
ผลลัพธ์ ผู้อ่านที่คุ้นเคยกับกองข้อมูล structure2 จะ recog - การแจกแจงทวินาม
การแปล กรุณารอสักครู่..
