The dictionary data structure is ub

The dictionary data structure is ubiquitous in computer science. A dictionary
is used for maintaining a set S under insertion and deletion of
elements (referred to as keys) from a universe U. Membership queries
(“x ∈ S?”) provide access to the data. In case of a positive answer the
dictionary also provides a piece of satellite data that was associated with
x when it was inserted.
A large theory, partially surveyed in Section 2, is devoted to dictionaries.
It is common to study the case where keys are bit strings in U = {0, 1}
w
and w is the word length of the computer (for theoretical purposes modeled
as a RAM). Section 3 discusses this restriction. It is usually, though not
always, clear how to return associated information once membership has
been determined. E.g., in all methods discussed in this paper, the associated
information of x ∈ S can be stored together with x in a hash table.
Therefore we disregard the time and space used to handle associated information
and concentrate on the problem of maintaining S. In the following
we let n denote |S|.
The most efficient dictionaries, in theory and in practice, are based on
hashing techniques. The main performance parameters are of course lookup
time, update time, and space. In theory there is no trade-off between these:
One can simultaneously achieve constant lookup time, expected amortized
constant update time, and space within a constant factor of the information
theoretical minimum of B = log
|U|
n

bits [6]. In practice, however, the
various constant factors are crucial for many applications. In particular,
lookup time is a critical parameter. It is well known that one can achieve
performance arbitrarily close to optimal if a sufficiently sparse hash table is
used. Therefore the challenge is to combine speed with a reasonable space
usage. In particular, we only consider schemes using O(n) words of space.
The contribution of this paper is a new, simple hashing scheme called
Cuckoo Hashing. A description and analysis of the scheme is given in
Section 4, showing that it possesses the same theoretical properties as the
dynamic dictionary of Dietzfelbinger et al. [10]. That is, it has worst case
constant lookup time and amortized expected constant time for updates.
A special feature of the lookup procedure is that (disregarding accesses
to a small hash function description) there are just two memory accesses,
which are independent and can be done in parallel if this is supported by
the hardware. Our scheme works for space similar to that of binary search
trees, i.e., three words per key in S on average.
Using weaker hash functions than those required for our analysis, Cuckoo
Hashing is very simple to implement. Section 5 describes such an implementation,
and reports on extensive experiments and comparisons with the
most commonly used methods, having no nontrivial worst case guarantee
CUCKOO HASHING 3
on lookup time. It seems that an experiment comparing the most commonly
used methods on a modern multi-level memory architecture has not
previously been described in the literature. Our experiments show Cuckoo
Hashing to be quite competitive, especially when the dictionary is small
enough to fit in cache. We thus believe it to be attractive in practice, when
a worst case guarantee on lookups is desired.

bits [6]. In practice, however, the
various constant factors are crucial for many applications. In particular,
lookup time is a critical parameter. It is well known that one can achieve
performance arbitrarily close to optimal if a sufficiently sparse hash table is
used. Therefore the challenge is to combine speed with a reasonable space
usage. In particular, we only consider schemes using O(n) words of space.
The contribution of this paper is a new, simple hashing scheme called
Cuckoo Hashing. A description and analysis of the scheme is given in
Section 4, showing that it possesses the same theoretical properties as the
dynamic dictionary of Dietzfelbinger et al. [10]. That is, it has worst case
constant lookup time and amortized expected constant time for updates.
A special feature of the lookup procedure is that (disregarding accesses
to a small hash function description) there are just two memory accesses,
which are independent and can be done in parallel if this is supported by
the hardware. Our scheme works for space similar to that of binary search
trees, i.e., three words per key in S on average.
Using weaker hash functions than those required for our analysis, Cuckoo
Hashing is very simple to implement. Section 5 describes such an implementation,
and reports on extensive experiments and comparisons with the
most commonly used methods, having no nontrivial worst case guarantee
CUCKOO HASHING 3
on lookup time. It seems that an experiment comparing the most commonly
used methods on a modern multi-level memory architecture has not
previously been described in the literature. Our experiments show Cuckoo
Hashing to be quite competitive, especially when the dictionary is small
enough to fit in cache. We thus believe it to be attractive in practice, when
a worst case guarantee on lookups is desired.

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

โครงสร้างพจนานุกรมข้อมูลเป็นในวิทยาการคอมพิวเตอร์ พจนานุกรมใช้สำหรับการรักษาชุด S ภายใต้แทรกและการลบองค์ประกอบ (เรียกว่าคีย์) จากการสอบถามสมาชิกประเทศจักรวาล(“x ∈ S?”) ให้เข้าถึงข้อมูล ในกรณีที่คำตอบพจนานุกรมยังมีชิ้นส่วนของข้อมูลดาวเทียมที่เชื่อมโยงกับx เมื่อมันถูกแทรกทฤษฎีขนาดใหญ่ สำรวจบางส่วนในส่วน 2 ทุ่มเทเพื่อพจนานุกรมทั่วไปศึกษากรณีที่คีย์เป็นบิตสตริงการใน U = {0, 1 }wและ w คือ ความยาวคำของคอมพิวเตอร์ (ประสงค์ทฤษฎีจำลองเป็น RAM) หมวดที่ 3 กล่าวถึงข้อจำกัดนี้ เป็นปกติ แต่ไม่เสมอ ล้างวิธีการส่งกลับข้อมูลที่เกี่ยวข้องเมื่อมีสมาชิกการกำหนด ในวิธีทั้งหมดที่กล่าวถึงในเอกสารนี้ ที่เกี่ยวข้องเช่นสามารถจัดเก็บข้อมูลของ x ∈ S กับ x ในตารางแฮชดังนั้น เราไม่สนใจเวลาและพื้นที่ที่ใช้ในการจัดการข้อมูลที่เกี่ยวข้องและเน้นปัญหาของ s ได้ ในต่อไปนี้เราให้ n ที่แสดง |S|ตามพจนานุกรมมีประสิทธิภาพมากที่สุด ในทางทฤษฎี และ ในทาง ปฏิบัติhashing เทคนิค พารามิเตอร์หลักประสิทธิภาพของหลักสูตรค้นหาเวลา ปรับปรุงเวลา และพื้นที่ ในทางทฤษฎี มีไม่ trade-off ระหว่างเหล่านี้:หนึ่งพร้อมกันสามารถใช้ค้นหาค่าคงเวลา คาดซึ่งตัดจำหน่ายเวลาคงปรับปรุง และพื้นที่ภายในตัวคูณคงที่ของข้อมูลทฤษฎีขั้นต่ำของ B =ล็อก|U|nบิต [6] ในทางปฏิบัติ อย่างไรก็ตาม การปัจจัยคงต่าง ๆ มีความสำคัญสำหรับการใช้งานมาก โดยเฉพาะเวลาค้นหาเป็นพารามิเตอร์สำคัญ เป็นที่รู้จักที่หนึ่งสามารถบรรลุประสิทธิภาพโดยใกล้สุดถ้าตารางแฮพอบ่อคือใช้ ดังนั้น ความท้าทายคือการ รวมความเร็ว มีพื้นที่เหมาะสมการใช้งาน โดยเฉพาะ เราเท่านั้นให้พิจารณาใช้คำ O(n) พื้นที่แผนงานสัดส่วนของกระดาษนี้เป็นใหม่ ง่าย hashing แบบเรียกว่าCuckoo Hashing คำอธิบายและวิเคราะห์ของแผนจะกำหนดส่วน 4 แสดงว่า มันมีคุณสมบัติทฤษฎีเดียวกันเป็นการไดนามิกพจนานุกรมของ Dietzfelbinger et al. [10] กล่าวคือ มันมีกรณีเลวร้ายที่สุดค้นหาค่าคงซึ่งตัดจำหน่าย และเวลาคาดว่าเวลาคงที่การปรับปรุงลักษณะพิเศษของกระบวนการค้นหาว่า (โดยหาคำอธิบายเกี่ยวกับฟังก์ชันแฮเล็ก) มีเพียงสองหาหน่วยความจำที่เป็นอิสระ และสามารถทำควบคู่กันหากนี้สนับสนุนฮาร์ดแวร์ โครงร่างของเราทำงานในพื้นที่คล้ายกับการค้นหาแบบทวิภาคต้นไม้ เช่น สามคำต่อป้อน S โดยเฉลี่ยใช้ฟังก์ชันแฮแข็งแกร่งกว่าที่จำเป็นสำหรับการวิเคราะห์ของเรา CuckooHashing เป็นง่ายมากที่จะใช้ ส่วน 5 อธิบายเช่นการนำไปใช้และรายงานเกี่ยวกับการทดลองอย่างละเอียดและเปรียบเทียบกับการมักใช้วิธี มีกรณีเลวไม่ nontrivial รับประกันCUCKOO HASHING 3เวลาค้นหา มันดูเหมือนว่าการทดลองเปรียบเทียบมากสุดโดยทั่วไปวิธีใช้ในสถาปัตยกรรมสมัยใหม่หน่วยความจำหลายระดับไม่ได้ก่อนหน้านี้ ได้อธิบายไว้ในวรรณคดี การทดลองของเราแสดง CuckooHashing เป็นค่อนข้างแข่งขัน โดยเฉพาะอย่างยิ่งเมื่อพจนานุกรมมีขนาดเล็กพอที่จะใส่ในแคช เราจึงเชื่อว่ามันมีเสน่ห์ในทางปฏิบัติ เมื่อต้องมีการรับประกันกรณีเลวร้ายที่สุดในการค้นหา

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

โครงสร้างข้อมูลพจนานุกรมเป็นที่แพร่หลายในวิทยาการคอมพิวเตอร์ พจนานุกรม
ถูกนำมาใช้ในการรักษา S ชุดภายใต้การแทรกและลบ
องค์ประกอบ (เรียกว่าคีย์) จากจักรวาล U. การสอบถามสมาชิก
("x ∈ S?") ให้สามารถเข้าถึงข้อมูล ในกรณีที่มีคำตอบในเชิงบวก
พจนานุกรมนอกจากนี้ยังมีชิ้นส่วนของข้อมูลดาวเทียมที่มีความสัมพันธ์กับ
x เมื่อมันถูกแทรก.
ทฤษฎีขนาดใหญ่สำรวจบางส่วนในส่วนที่ 2 คือการทุ่มเทให้กับพจนานุกรม.
มันเป็นเรื่องธรรมดาที่จะศึกษากรณีที่เป็นกุญแจ สตริงบิตใน U = {0, 1}
W
และ W คือความยาวของคำของคอมพิวเตอร์ (สำหรับวัตถุประสงค์ทางทฤษฎีแบบจำลอง
เป็น RAM) มาตรา 3 กล่าวถึงข้อ จำกัด นี้ มันเป็นเรื่องปกติ แต่ไม่
เคยชัดเจนถึงวิธีการส่งกลับข้อมูลที่เกี่ยวข้องที่ครั้งหนึ่งเคยเป็นสมาชิกได้
รับการพิจารณา เช่นในวิธีการทั้งหมดที่กล่าวถึงในบทความนี้ที่เกี่ยวข้อง
ข้อมูลของ x ∈ S สามารถเก็บไว้พร้อมกับ x ในตารางแฮช.
ดังนั้นเราจึงไม่สนใจเวลาและพื้นที่ใช้ในการจัดการข้อมูลที่เกี่ยวข้อง
และมีสมาธิในการแก้ปัญหาในการรักษาเอใน ต่อไปนี้
เราให้ n แสดง | S |.
พจนานุกรมมีประสิทธิภาพมากที่สุดในทางทฤษฎีและในทางปฏิบัติอยู่บนพื้นฐานของ
เทคนิค hashing ค่าประสิทธิภาพหลักของการค้นหามีแน่นอน
เวลาเวลาการปรับปรุงและพื้นที่ ในทางทฤษฎีจะไม่มีการปิดระหว่างนี้::
หนึ่งพร้อมกันสามารถบรรลุเวลาค้นหาอย่างต่อเนื่องคาดว่าตัดจำหน่าย
เวลาการปรับปรุงอย่างต่อเนื่องและพื้นที่ภายในเป็นปัจจัยคงที่ของข้อมูล
ขั้นต่ำทฤษฎีของ B = เข้าสู่ระบบ
| U |
n
?
บิต [6] ในทางปฏิบัติอย่างไรก็ตาม
ปัจจัยคงที่ต่างๆมีความสำคัญสำหรับการใช้งานมาก โดยเฉพาะอย่างยิ่ง
เวลาค้นหาเป็นพารามิเตอร์ที่สำคัญ มันเป็นที่รู้จักกันดีว่าหนึ่งสามารถบรรลุ
ผลการดำเนินงานโดยพลใกล้กับที่ดีที่สุดถ้าตารางแฮชเบาบางพอที่จะ
นำมาใช้ ดังนั้นความท้าทายคือการรวมความเร็วที่มีพื้นที่ที่เหมาะสม
การใช้งาน โดยเฉพาะอย่างยิ่งที่เราจะพิจารณารูปแบบการใช้ O (n) คำพูดของพื้นที่.
มีส่วนร่วมของกระดาษนี้เป็นใหม่โครงการคร่ำเครียดง่ายเรียกว่า
นกกาเหว่า Hashing คำอธิบายและการวิเคราะห์ของโครงการจะได้รับใน
ส่วนที่ 4 แสดงให้เห็นว่ามันมีคุณสมบัติทางทฤษฎีเดียวกับ
พจนานุกรมแบบไดนามิกของ Dietzfelbinger และคณะ [10] นั่นคือมันมีกรณีที่เลวร้ายที่สุด
เวลาการค้นหาอย่างต่อเนื่องและตัดจำหน่ายคาดว่าเวลาสำหรับการปรับปรุงอย่างต่อเนื่อง.
คุณสมบัติพิเศษของขั้นตอนการค้นหาที่เป็นที่ (ไม่คำนึงถึงการเข้าถึง
การอธิบายฟังก์ชันแฮชเล็ก) มีเพียงสองเข้าถึงหน่วยความจำ,
ซึ่งมีความเป็นอิสระและสามารถ ทำในแบบคู่ขนานว่านี้ได้รับการสนับสนุนโดย
ฮาร์ดแวร์ โครงการของเราทำงานสำหรับพื้นที่คล้ายกับว่าการค้นหาแบบไบนารี
ต้นไม้คือสามคำต่อสำคัญใน S โดยเฉลี่ย.
การใช้ฟังก์ชั่นปรับตัวลดลงกว่าที่จำเป็นสำหรับการวิเคราะห์ของเรานกกาเหว่า
Hashing เป็นเรื่องง่ายมากที่จะใช้ หมวดที่ 5 อธิบายการดำเนินการดังกล่าว,
และรายงานเกี่ยวกับการทดลองอย่างกว้างขวางและเปรียบเทียบกับ
วิธีการที่ใช้กันมากที่สุดมีไม่มีกรณีที่เลวร้ายขี้ปะติ๋วรับประกัน
กุ๊กกู hashing 3
ในเวลาค้นหา ดูเหมือนว่าการทดลองเปรียบเทียบกันมากที่สุด
วิธีการที่ใช้ในสถาปัตยกรรมหน่วยความจำหลายระดับที่ทันสมัยยังไม่ได้
รับก่อนหน้านี้ที่อธิบายไว้ในวรรณคดี การทดลองของเราแสดงนกกาเหว่า
Hashing จะมีการแข่งขันโดยเฉพาะอย่างยิ่งเมื่อพจนานุกรมที่มีขนาดเล็ก
พอที่จะใส่ในแคช ดังนั้นเราจึงเชื่อว่ามันจะเป็นที่น่าสนใจในการปฏิบัติเมื่อ
รับประกันกรณีที่เลวร้ายที่สุดในการค้นหาเป็นที่ต้องการ

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

พจนานุกรมโครงสร้างข้อมูลเป็นที่แพร่หลายในคอมพิวเตอร์ พจนานุกรม
ใช้รักษาชุดในการแทรกและการลบ
ธาตุ ( เรียกว่าคีย์ ) จากจักรวาล . . สมาชิกสอบถาม
( x ∈ S ? " ) ให้บริการการเข้าถึงข้อมูล ในกรณีที่เป็นบวกตอบ
พจนานุกรมยังมีชิ้นส่วนของข้อมูลดาวเทียมที่เกี่ยวข้องกับ
x
เมื่อมันถูกแทรกทฤษฎีขนาดใหญ่บางส่วนหนึ่งในส่วนที่ 2 คือเพื่อรองรับพจนานุกรม .
เป็นการทั่วไป เพื่อศึกษากรณีว่าคีย์เป็นบิตสตริงใน U = { 0 , 1 }
w
w เป็นคำและความยาวของคอมพิวเตอร์ ( เพื่อวัตถุประสงค์ในทางทฤษฎีแบบจำลอง
เป็น RAM ) ส่วนที่ 3 กล่าวถึงข้อ จำกัด นี้ เป็นปกติ แม้ว่าจะไม่ได้
เสมอ ชัดเจนว่าจะกลับมาเชื่อมโยงข้อมูลเมื่อสมาชิกมี
ที่ถูกกำหนดไว้ เช่นในวิธีการทั้งหมดที่กล่าวถึงในบทความนี้เกี่ยวข้อง
ข้อมูล x ∈สามารถเก็บไว้ด้วยกันกับ X ในตารางแฮช .
เพราะฉะนั้นเราไม่สนใจเรื่องเวลาและพื้นที่ที่ใช้การจัดการที่เกี่ยวข้องข้อมูล
และสนใจปัญหาของการรักษา S .
เราขอแสดง | s n
พจนานุกรม | ดังต่อไปนี้ ที่มีประสิทธิภาพที่สุดในทางทฤษฎีและปฏิบัติ ตาม
บริการเทคนิคพารามิเตอร์ประสิทธิภาพหลักของหลักสูตรการค้นหา
เวลา , เวลา , ปรับปรุง และพื้นที่ ในทางทฤษฎี ไม่มีการแลกเปลี่ยนระหว่างเหล่านี้ :
1 พร้อมกันสามารถบรรลุเวลาค้นหาคงที่ คาดว่าของขวัญ
คงที่ปรับปรุงเวลาและพื้นที่ภายในคงที่องค์ประกอบของข้อมูลทฤษฎีที่น้อยที่สุดของ B =
U

| เข้าสู่ระบบ | n

บิต [ 6 ] อย่างไรก็ตามในทางปฏิบัติ ,
ปัจจัยคงที่ต่างๆเป็นสิ่งสำคัญสำหรับการใช้งานมาก โดย
เวลาค้นหาเป็นพารามิเตอร์สำคัญ มันเป็นที่รู้จักกันดีว่าหนึ่งสามารถบรรลุประสิทธิภาพที่ดีที่สุด
โดยพลใกล้ถ้าตารางแฮชเบาบางพอสมควร คือ
ใช้ . ดังนั้น ความท้าทายคือการใช้ความเร็ว ด้วยการใช้พื้นที่
ที่เหมาะสม โดยเฉพาะ เราเท่านั้น พิจารณาโครงร่างการใช้ O ( n
) คำพูดของพื้นที่ผลงานของกระดาษนี้เป็นใหม่อย่างง่าย hashing โครงการที่เรียกว่า
นกกาเหว่า hashing . คำอธิบายและการวิเคราะห์ของโครงการจะได้รับใน
ส่วนที่ 4 แสดงให้เห็นว่ามันมีทฤษฎีเดียวกันคุณสมบัติเป็น
พจนานุกรมแบบไดนามิกของ dietzfelbinger et al . [ 10 ] คือว่า มันมีกรณีที่เลวร้ายที่สุด
คงค้นหาเวลาและของขวัญคาดว่าคงที่สำหรับการปรับปรุง .
คุณลักษณะพิเศษของกระบวนการค้นหานั้น ( เรื่องเข้าถึง
ต้องอธิบายฟังก์ชันแฮชขนาดเล็ก ) มีเพียงสองหน่วยเข้าถึง
ที่เป็นอิสระ , และสามารถทำควบคู่กัน ถ้านี้ได้รับการสนับสนุนโดย
ฮาร์ดแวร์ โครงการของเราสำหรับงานพื้นที่คล้ายกับที่ของการค้นหาแบบทวิภาค
ต้นไม้ เช่น คําสามคําต่อคีย์ S
เฉลี่ยการใช้ฟังก์ชันที่อ่อนแอกว่าที่จำเป็นสำหรับการวิเคราะห์ของเราเป็นบ้า
hashing คือง่ายมากที่จะใช้ . มาตรา ๕ อธิบายเรื่องการดำเนินงานและรายงานเกี่ยวกับการทดลองอย่างละเอียด

และเปรียบเทียบกับวิธีการที่ใช้บ่อยที่สุด ไม่มีนอนทริเวียล กรณีที่เลวร้ายที่สุด รับประกัน

คุคคู hashing 3 เวลาการค้นหา ดูเหมือนว่าการทดลองเปรียบเทียบมากที่สุด
ใช้วิธีการที่ทันสมัยหลายหน่วยความจำสถาปัตยกรรมไม่ได้
ก่อนหน้านี้ถูกอธิบายไว้ในวรรณกรรม การทดลองของเราแสดงเป็นบ้า
แฮชที่จะแข่งขันมากโดยเฉพาะเมื่อเป็นพจนานุกรมขนาดเล็ก
พอที่จะใส่ในแคช เราจึงเชื่อว่ามันเป็นที่น่าสนใจในการฝึก เมื่อ
กรณีเลวร้ายที่สุด คือ การค้นหา
รับประกันต้องการ

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.