A relational query execution plan i

A relational query execution plan is a graph of relational algebra operators and the operators in a graph can be executed in parallel. If an operator consumes the output of a second operator, its pipelined parallelism; if not, the two operators can proceed essentially independently. An operator is said to block if it produces no output until it has consumed all its inputs. Pipelined parallelism is limited by the presence of operators (e.g., sorting or aggregation) that block.

The key to evaluating an operator in parallel is to partition the input data; we can then work on each partition in parallel and combine the results. This approach is called data-partitioned parallel evaluation.

Data Partitioning

Partitioning a large dataset horizontally across several disks enables us to exploit the I/O bandwidth of the disks by reading and writing them in parallel. There are several ways to horizontally partition a relation. If there are n processors, the ith tuple is assigned to processor i mod n in round-robin partitioning. In hash partitioning, a hash function is applied to a tuple to determine its processor. In range partitioning, tuples are sorted (conceptually), and n ranges are chosen for the sort key values so that each range contains roughly the same number of tuples; tuples in range i are assigned to processor i.

Round-robin partitioning is suitable for eciently evaluating queries that access the entire relation. If only a subset of the tuples (e.g., those that satisfy the selection con-dition age = 20) is required, hash partitioning and range partitioning are better than round-robin partitioning because they enable us to access only those disks that contain matching tuples.If range selections such as 15

The key to evaluating an operator in parallel is to partition the input data; we can then work on each partition in parallel and combine the results. This approach is called data-partitioned parallel evaluation.

Data Partitioning

Partitioning a large dataset horizontally across several disks enables us to exploit the I/O bandwidth of the disks by reading and writing them in parallel. There are several ways to horizontally partition a relation. If there are n processors, the ith tuple is assigned to processor i mod n in round-robin partitioning. In hash partitioning, a hash function is applied to a tuple to determine its processor. In range partitioning, tuples are sorted (conceptually), and n ranges are chosen for the sort key values so that each range contains roughly the same number of tuples; tuples in range i are assigned to processor i.

Round-robin partitioning is suitable for eciently evaluating queries that access the entire relation. If only a subset of the tuples (e.g., those that satisfy the selection con-dition age = 20) is required, hash partitioning and range partitioning are better than round-robin partitioning because they enable us to access only those disks that contain matching tuples.If range selections such as 15

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

แผนการดำเนินการแบบสอบถามเชิงกราฟของตัวดำเนินการพีชคณิตเชิงสัมพันธ์ และผู้ประกอบการในกราฟสามารถดำเนินการควบคู่กัน ถ้าตัวดำเนินใช้ผลผลิตของตัวที่สอง การ parallelism pipelined ถ้า ไม่มี ตัวที่สองสามารถดำเนินการอย่างเป็นอิสระ ตัวดำเนินมีกล่าวถึงบล็อกถ้ามันผลิตไม่แสดงผลจนกว่าจะได้ใช้อินพุตของ Pipelined parallelism ถูกจำกัด โดยของตัวดำเนินการ (เช่น การเรียงลำดับหรือรวม) บล็อกที่

คีย์เพื่อประเมินการดำเนินการควบคู่กันคือการ แบ่งพาร์ติชันข้อมูลอินพุต เราสามารถทำงานในแต่ละพาร์ติชันพร้อมกัน และรวมผลลัพธ์ วิธีการนี้เรียกว่าสร้างพาร์ติชันข้อมูลแบบประเมิน

พาร์ทิชันข้อมูล

พาร์ทิชันการชุดข้อมูลขนาดใหญ่ในแนวนอนทั่วดิสก์หลายช่วยให้เราสามารถใช้แบนด์วิธ I/O ของดิสก์ โดยการอ่าน และการเขียนควบคู่กัน มีหลายวิธีสามารถแบ่งความสัมพันธ์ในแนวนอน ถ้ามี n โปรเซสเซอร์ ทูเพิลระยะกำหนดประมวลผม mod n ในพาร์ทิชันแบบวน ในแฮพาร์ทิชัน ฟังก์ชันแฮชที่ใช้กับทูเพิลเพื่อตรวจสอบการประมวลผล ในช่วงการพาร์ทิชัน tuples เรียงลำดับ (ทางแนวคิด), และช่วง n จะถูกเลือกสำหรับค่าของคีย์เรียงลำดับเพื่อให้แต่ละช่วงประกอบด้วยประมาณจำนวนของ tuples tuples ในช่วงที่กำหนดประมวลผล i.

วนพาร์ทิชันเหมาะสมสำหรับ eciently ประเมินแบบสอบถามที่เข้าถึงความสัมพันธ์ทั้งหมด ถ้าเฉพาะชุดย่อยของ tuples ใน (เช่น ผู้ที่ตอบสนองการเลือกคอน dition อายุ = 20) คือต้อง แฮพาร์ทิชันและพาร์ทิชันช่วงดีกว่าพาร์ทิชันแบบวนรอบเนื่องจากจะช่วยให้เราสามารถเข้าถึงดิสก์ที่ประกอบด้วย tuples ตรงเหล่านั้นถ้าช่วงเลือกเช่น 15 < อายุ < 25 จะระบุกลุ่ม พาร์ทิชันช่วงคือจะแบ่งพาร์ทิชันแฮ เพราะ tuples คัดเลือกมักจะจับกลุ่มกันบนตัวประมวลผลกี่ บนมืออื่น ๆ พาร์ทิชันช่วงสามารถนำข้อมูลต้นฉบับเอียงอัตโนมัติ นั่นคือ กั้นห้อง ด้วยกันแตกต่างกันจำนวน tuples ในดิสก์หรือพาร์ติชัน การเอียงทำให้โปรเซสเซอร์กับพาร์ทิชันขนาดใหญ่จะกลายเป็น คอขวดของประสิทธิภาพการทำงาน พาร์ทิชันแฮชที่มีคุณธรรมเพิ่มเติมซึ่งมันทำให้ข้อมูลกระจายอย่างสม่ำเสมอแม้ว่าข้อมูลการขยาย และลดขนาดเวลาผ่าน

รหัสประเมินที่ลำดับตัวดำเนินการที่ Parallelizing

สถาปัตยกรรมซอฟต์แวร์บริการสำหรับ DBMSs แบบขนานช่วยให้เราพร้อม

การ

parallelize รหัสที่มีอยู่ในการประเมินการดำเนินการเชิงสัมพันธ์ตามลำดับ ความคิดพื้นฐานคือการ ใช้ข้อมูลแบบขนาน กระแสข้อมูลถูกผสานตามอินพุตที่ให้ตัวดำเนินการเชิงสัมพันธ์ และการแสดงผลของตัวดำเนินจะแบ่งตามการ parallelize ตามมาประมวลผล

A พร้อมประเมินผลแผนประกอบด้วยข้อมูล? อ่าว เครือข่ายเชิง ผสาน และแบ่งตัว การรวมและการแบ่งตัวจะ buer ข้อมูลบางอย่าง และควรจะหยุดดำเนินการผลิตข้อมูลป้อนเข้า แล้วพวกเขาสามารถควบคุมความเร็วของการดำเนินการตามความเร็วในการดำเนินการดำเนินการที่ใช้ผลผลิตของพวกเขา

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

แผนปฏิบัติการแบบสอบถามเชิงสัมพันธ์เป็นกราฟของผู้ประกอบการพีชคณิตเชิงสัมพันธ์และผู้ประกอบการในรูปแบบกราฟสามารถดำเนินการในแบบคู่ขนาน หากผู้ประกอบการสิ้นเปลืองการส่งออกของผู้ประกอบการที่สองขนานของไปป์ไลน์; ถ้าไม่สองผู้ประกอบการสามารถดำเนินการเป็นหลักเป็นอิสระ ผู้ประกอบการบอกว่าจะป้องกันถ้ามันผลิตไม่ออกจนกว่าจะได้ใช้ปัจจัยการผลิตทั้งหมด ขนานไปป์ไลน์จะถูก จำกัด ด้วยการปรากฏตัวของผู้ประกอบการ (เช่นการเรียงลำดับหรือการรวม) ที่ป้องกันกุญแจสำคัญในการประเมินผลการดำเนินการในแบบคู่ขนานคือการแบ่งข้อมูลเข้า; แล้วเราสามารถทำงานในพาร์ทิชันแบบขนานกันและรวมผลลัพธ์ วิธีการนี้เรียกว่าการประเมินผลแบบขนานข้อมูลแบ่งพาร์ติชันข้อมูลพาร์ทิชันพาร์ทิชันชุดใหญ่ในแนวนอนในดิสก์หลายช่วยให้เราสามารถใช้ประโยชน์จาก I / O แบนด์วิดธ์ของดิสก์โดยการอ่านและการเขียนพวกเขาในแบบขนาน มีหลายวิธีที่จะมีความสัมพันธ์ในแนวนอนพาร์ทิชันที่ ถ้ามี n ประมวลผล tuple ที่ i ได้รับมอบหมายให้หน่วยประมวลผล i mod n ในรอบแบ่ง ในการแบ่งกัญชาฟังก์ชันแฮชจะถูกนำไปใช้กับ tuple เพื่อตรวจสอบการประมวลผลของ ในการแบ่งช่วง tuples จะถูกจัดเรียง (แนวคิด) และ n ช่วงจะถูกเลือกสำหรับการเรียงลำดับค่าคีย์เพื่อให้แต่ละช่วงมีประมาณจำนวนเดียวกันของ tuples; tuples ในช่วงที่ผมได้รับมอบหมายให้หน่วยประมวลผลฉันรอบแบ่งเหมาะสำหรับ eciently ประเมินแบบสอบถามที่เข้าถึงความสัมพันธ์ทั้ง หากเพียงส่วนหนึ่งของสิ่งอันดับ (เช่นผู้ที่ตอบสนองการเลือก con-dition อายุ = 20) จะต้องแบ่งกัญชาและการแบ่งช่วงที่ดีกว่ารอบแบ่งเพราะพวกเขาช่วยให้เราสามารถเข้าถึงดิสก์เหล่านั้นเท่านั้นที่มีการจับคู่สิ่งอันดับ . ถ้าเลือกช่วงเช่น 15

parallelizing ลำดับผู้ประกอบการประเมินผลการรหัสสถาปัตยกรรมซอฟต์แวร์ที่หรูหราสำหรับ DBMSs ขนานช่วยให้เราสามารถหาได้ง่ายขนานรหัสที่มีอยู่ในการประเมินตามลำดับผู้ประกอบการสัมพันธ์ แนวคิดพื้นฐานคือการใช้กระแสข้อมูลแบบขนาน ลำธารที่มีการควบรวมกิจการตามความจำเป็นเพื่อให้ปัจจัยการผลิตสำหรับผู้ประกอบการสัมพันธ์และการส่งออกของผู้ประกอบการจะแบ่งตามความจำเป็นเพื่อการประมวลผลที่ตามมาขนานแผนประเมินผลแบบขนานประกอบด้วยข้อมูล? โอ๊ยเครือข่ายของความสัมพันธ์ผสานและผู้ประกอบการแยก ผู้ประกอบการผสานและแยกควรจะสามารถ Buer ข้อมูลบางอย่างและควรจะสามารถที่จะหยุดการผลิตผู้ประกอบการป้อนข้อมูลของพวกเขา แล้วพวกเขาก็สามารถควบคุมความเร็วของการดำเนินการตามความเร็วการดำเนินการของผู้ประกอบการที่กินผลผลิตของพวกเขา

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

สัมพันธ์แบบสอบถามการดำเนินการวางแผนเป็นกราฟของผู้ประกอบการพีชคณิตเชิงสัมพันธ์และผู้ประกอบการในกราฟที่สามารถดำเนินการในแบบคู่ขนาน ถ้าผู้ประกอบการจะส่งออกของผู้ประกอบการที่สองของ pipelined ขนาน ; ถ้าไม่สองผู้ประกอบการสามารถดำเนินการโดยอิสระ โอเปอเรเตอร์บอกว่าบล็อกถ้ามันผลิตไม่มีผลจนกว่าจะได้ใช้ข้อมูลทั้งหมดของpipelined ขนานจะถูก จำกัด โดยมี ของผู้ประกอบการ ( เช่นการเรียงลำดับหรือการรวม ) บล็อกที่

คีย์เพื่อประเมินผู้ประกอบการในแบบคู่ขนานคือพาร์ทิชันข้อมูลที่ป้อนเข้า เราก็จะสามารถทํางานในแต่ละพาร์ทิชันแบบขนานและรวมผล วิธีการนี้เรียกว่าข้อมูลแบ่งการประเมินแบบขนาน ข้อมูลพาร์ทิชัน

พาร์ทิชันข้อมูลใหญ่แนวนอนข้ามหลายดิสก์จะช่วยให้เราสามารถใช้ประโยชน์จากแบนด์วิดธ์ของดิสก์ I / O โดยการอ่านและการเขียนในแบบขนาน มีหลายวิธีในแนวนอนกั้นความสัมพันธ์ . ถ้าไม่มี N processors , ith tuple คือมอบหมายหน่วยประมวลผลผม mod n รอบโรบินพาร์ทิชัน . ในการกัญชา ,แฮชฟังก์ชันที่ใช้จะเป็นทูเปิลเพื่อตรวจสอบของหน่วยประมวลผล ในช่วงที่แบ่งการที่มีการเรียงลำดับ ( แนวคิด ) และช่วงที่เลือกสำหรับการจัดเรียงค่าคีย์นั้น แต่ละช่วงมีการประมาณจำนวนเดียวกันของทูเปิล ; ทูเปิลในช่วงผมมอบหมายให้ตัวผม

รอบโรบินการเหมาะสำหรับ eciently ประเมินแบบสอบถามการเข้าถึงความสัมพันธ์ทั้งหมดถ้าเป็นเซตย่อยของทูเปิล ( เช่นผู้ที่ตอบสนองการต่อต้าน dition อายุ = 20 ) จะต้องสับแบ่งพาร์ทิชันและช่วงการดีกว่าโรบินแยกเพราะพวกเขาช่วยให้เราสามารถเข้าถึงดิสก์เหล่านั้นเท่านั้นที่มีการจับคู่ที่มีให้เลือก เช่น ถ้าช่วง 15 < < specied อายุ 25 ,ช่วงการเหนือกว่ากัญชา เพราะคุณสมบัติที่มีการมีแนวโน้มที่จะเป็นกลุ่มด้วยกันสองสาม ) บนมืออื่น ๆ , ช่วงการสามารถนําข้อมูลที่บิดเบือน นั่นคือ หมายเลขของพาร์ทิชันที่มีแตกต่างกันอย่างกว้างขวางที่มีในพาร์ทิชันหรือดิสก์ สาเหตุที่เกี่ยวข้องกับพาร์ทิชันขนาดใหญ่แบบเอียงจะกลายเป็นคอขวดประสิทธิภาพกัญชาการมีเพิ่มเติมคุณธรรมมันกระจายอยู่ทั่วไป แม้ว่าข้อมูลที่เติบโตขึ้นและหดตัวตลอดเวลา ข้อมูล

parallelizing ต่อเนื่องผู้ประกอบการประเมินสถาปัตยกรรมซอฟต์แวร์รหัส

สวยขนาน DBMSs ช่วยให้เราพร้อม

parallelize ที่มีอยู่เป็นรหัสตามลำดับการประเมินเชิงปฏิบัติการ แนวคิดพื้นฐานคือการใช้กระแสข้อมูลแบบขนานกระแส จะรวมได้ตามต้องการเพื่อให้ข้อมูลสำหรับผู้ประกอบการสัมพันธ์และการส่งออกของผู้ประกอบการ คือ แยกเป็นต้อง parallelize การประมวลผลที่ตามมา

แผนประเมินผลขนานประกอบด้วย�ข้อมูล ? ๆของเครือข่ายผู้ประกอบการสัมพันธ์ , ผสานและแยกผสานและแยกผู้ประกอบการควรจะบูเออร์ข้อมูลบางอย่างและควรจะหยุดผู้ประกอบการผลิตป้อนข้อมูลของพวกเขา จากนั้นพวกเขาสามารถควบคุมความเร็วของการดำเนินการตามการใช้ความเร็วของผู้ประกอบการที่ออกของพวกเขา

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.