EXPERIMENTAL EVALUATIONWe evaluate

EXPERIMENTAL EVALUATION
We evaluate our approach on a 32-core Intel Xeon system with four eight-core X7560 CPUs. We implemented our
speculation scheme in MIT Cilk version 5.4.6. All benchmarks were compiled with GNU gcc version 4.1.2 and optimization ’-O2’. Table 1 lists the benchmarks used along
with their problem sizes and single-threaded execution time.
To balance the amount of concurrency exposed and the performance achieved by the sequential kernel, recursive programs typically switch from a parallel to an optimized serial
implementation once a particular problem size cut-off (base
case) is reached. We implement efficient tiled versions of the
benchmarks. For each benchmark, we choose the tile/block
size that achieved the best performance for Cilk. Read/write
instrumentation is added at the tile granularity to reduce instrumentation overhead. We observe no additional overhead
due to instrumentation. Speedups are plotted against this
instrumented baseline Cilk version.
As seen in Table 1, LCS computes the longest common
subsequence. RNA solves the RNA folding problem. Seidel2d implements the two-dimensional iterative Gauss-Seidel
algorithm. Wave2d is representative of a typical wavefront
algorithm. These benchmarks are candidates that exhibit
constrained expression of concurrency in recursive-style programming. To evaluate the overhead of various speculation
schemes in the presence of abundant concurrency, we select a three-dimensional wavefront example (Wave3d) with
a sufficiently large problem size.
For each benchmark, we compare the performance of the
baseline Cilk implementation with four speculation schemes:
(1) always, a scheme that always speculates when a sync is
about to be suspended without relying on the predictor; (2)
pred, the single-step speculator based on the predictor; (3)
deep, the deep speculation scheme; and (4) para, the parallel
speculation scheme. The latter three schemes also include
the delayed speculation optimization. We benchmark each
scheme separately. Note that the schemes themselves are
inclusive

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

EXPERIMENTAL EVALUATIONWe evaluate our approach on a 32-core Intel Xeon system with four eight-core X7560 CPUs. We implemented ourspeculation scheme in MIT Cilk version 5.4.6. All benchmarks were compiled with GNU gcc version 4.1.2 and optimization ’-O2’. Table 1 lists the benchmarks used alongwith their problem sizes and single-threaded execution time.To balance the amount of concurrency exposed and the performance achieved by the sequential kernel, recursive programs typically switch from a parallel to an optimized serialimplementation once a particular problem size cut-off (basecase) is reached. We implement efficient tiled versions of thebenchmarks. For each benchmark, we choose the tile/blocksize that achieved the best performance for Cilk. Read/writeinstrumentation is added at the tile granularity to reduce instrumentation overhead. We observe no additional overheaddue to instrumentation. Speedups are plotted against thisinstrumented baseline Cilk version.As seen in Table 1, LCS computes the longest commonsubsequence. RNA solves the RNA folding problem. Seidel2d implements the two-dimensional iterative Gauss-Seidelalgorithm. Wave2d is representative of a typical wavefrontalgorithm. These benchmarks are candidates that exhibitconstrained expression of concurrency in recursive-style programming. To evaluate the overhead of various speculationschemes in the presence of abundant concurrency, we select a three-dimensional wavefront example (Wave3d) withมีปัญหามากพอขนาดนั้นสำหรับแต่ละเกณฑ์มาตรฐาน เราเปรียบเทียบประสิทธิภาพของการใช้งานพื้นฐานซิลก์ ซีสตาร์กับแผนสี่การเก็งกำไร:(1) เสมอ แผนที่ speculates เมื่อการซิงค์อยู่เสมอจะถูกระงับโดยไม่ต้องพึ่ง predictor (2)pred, speculator ขั้นตอนเดียวที่อิง predictor (3)ลึก แบบเก็งกำไรลึก และ พารา (4) การขนานรูปแบบการเก็งกำไร มีแบบแผนทั้งสามหลังการเพิ่มประสิทธิภาพการเก็งกำไรที่ล่าช้า เราเปรียบเทียบแต่ละโครงการแยกต่างหาก ใช้รูปแบบตัวเองรวม

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

ทดลองประเมินผล
เราจะประเมินวิธีการของเราใน 32-core Intel Xeon ระบบที่มีสี่แปด-core ซีพียู X7560 เราดำเนินการของเรา
โครงการเก็งกำไรใน MIT Cilk เวอร์ชัน 5.4.6 มาตรฐานทั้งหมดถูกรวบรวมกับ GNU GCC รุ่น 4.1.2 และการเพิ่มประสิทธิภาพ '-O2' ตารางที่ 1 แสดงมาตรฐานที่ใช้ตาม
ที่มีขนาดปัญหาของพวกเขาและเวลาการดำเนินการเธรดเดียว.
เพื่อความสมดุลของปริมาณของการทำงานพร้อมกันสัมผัสและประสิทธิภาพการทำงานประสบความสำเร็จโดยเคอร์เนลลำดับโปรแกรม recursive มักจะเปลี่ยนจากคู่ขนานไปยังอนุกรมการเพิ่มประสิทธิภาพ
การดำเนินงานที่ครั้งหนึ่งเคยเป็นปัญหาเฉพาะ ขนาดตัด (ฐาน
กรณี) จะมาถึง เราใช้รุ่นกระเบื้องที่มีประสิทธิภาพของ
มาตรฐาน สำหรับแต่ละมาตรฐานเราเลือกกระเบื้อง / บล็อก
ขนาดที่ประสบความสำเร็จในการดำเนินงานที่ดีที่สุดสำหรับการ Cilk อ่าน / เขียน
วัดที่ถูกเพิ่มเมล็ดกระเบื้องเพื่อลดค่าใช้จ่ายในการใช้เครื่องมือ เราสังเกตไม่มีค่าใช้จ่ายเพิ่มเติม
เนื่องจากการวัด speedups มีการพล็อตต่อนี้
instrumented พื้นฐานรุ่น Cilk.
เท่าที่เห็นในตารางที่ 1 LCS คำนวณที่ยาวที่สุดที่พบบ่อย
subsequence RNA แก้ปัญหา RNA พับ Seidel2d ดำเนินการซ้ำ Gauss-Seidel สองมิติ
ขั้นตอนวิธีการ Wave2d เป็นตัวแทนของคลื่นโดยทั่วไป
ขั้นตอนวิธีการ มาตรฐานเหล่านี้เป็นผู้ที่แสดงให้เห็นว่า
การแสดงออก จำกัด เห็นพ้องในการเขียนโปรแกรม recursive สไตล์ ในการประเมินค่าใช้จ่ายของการเก็งกำไรต่างๆ
รูปแบบในการปรากฏตัวพร้อมกันมากมายที่เราเลือกเป็นตัวอย่างที่คลื่นสามมิติ (Wave3d) ที่มี
ขนาดปัญหาขนาดใหญ่พอ.
สำหรับแต่ละมาตรฐานเราเปรียบเทียบประสิทธิภาพของ
พื้นฐานการดำเนินงาน Cilk กับสี่รูปแบบการเก็งกำไร :
(1) เสมอโครงการที่มักจะไม่มีผลตอบแทนเมื่อซิงค์เป็น
เรื่องเกี่ยวกับการถูกระงับโดยไม่ต้องอาศัยการทำนายนั้น (2)
pred การเก็งกำไรขั้นตอนเดียวอยู่บนพื้นฐานของการทำนายนั้น (3)
ลึกโครงการเก็งกำไรลึก และ (4) พาราขนาน
โครงการเก็งกำไร หลังสามรูปแบบ ได้แก่
การเพิ่มประสิทธิภาพการเก็งกำไรล่าช้า เรามาตรฐานแต่ละ
โครงการแยกต่างหาก โปรดทราบว่ารูปแบบที่ตัวเอง
รวม

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

การประเมินผลการทดลองเราประเมินวิธีการของเราใน 32 Core Intel ซีออนด้วยระบบสี่แปดหลัก x7560 ซีพียู เราใช้ของเราเก็งกำไรในโครงการด้วย cilk รุ่น 5.4.6 . ทั้งหมดจึงถูกรวบรวมกับ GNU GCC และรุ่นของ O2 เพิ่มประสิทธิภาพ " - " ตารางที่ 1 แสดงรายการมาตรฐานที่ใช้ตามกับปัญหาของพวกเขาและขนาดเดียว threaded เวลาประหารเพื่อความสมดุลของปริมาณการเปิดรับและการแสดงความโดยลำดับ recursive เคอร์เนล , โปรแกรมโดยปกติจะสลับจากการปรับพอร์ตขนานเมื่อขนาดของปัญหา โดยเฉพาะการตัด ( ฐานกรณี ) ถึง เราใช้ประสิทธิภาพของกระเบื้องรุ่นวัด สำหรับแต่ละรอยที่เราเลือกกระเบื้อง / บล็อกขนาดว่าบรรลุประสิทธิภาพที่ดีที่สุดสำหรับ cilk . อ่าน / เขียนเครื่องมือเพิ่มที่กระเบื้อง granularity เพื่อลดค่าใช้จ่ายเครื่องมือ เราสังเกต ไม่มี ค่าใช้จ่ายเพิ่มเติมเนื่องจากเครื่องมือ speedups จะงัดข้อกับนี้instrumented พื้นฐาน cilk รุ่นเท่าที่เห็นในตารางที่ 1 นักคำนวณยาวทั่วไปพลังใจ . แก้ไวรัส rna พับปัญหา seidel2d ใช้สองมิติของเกาส์ไซเดิลขั้นตอนวิธี wave2d เป็นตัวแทนของคลื่นทั่วไปขั้นตอนวิธี มาตรฐานเหล่านี้เป็นผู้ที่แสดงข้อ จำกัด ในการแสดงออกของการโปรแกรมแบบ recursive . การประเมินค่าใช้จ่ายต่างๆของการเก็งกำไรรูปแบบในการแสดงตนของการมากมายที่เราเลือกตัวอย่างคลื่นสามมิติ ( wave3d ) กับขนาดเป็นปัญหาใหญ่พอสมควรสำหรับแต่ละรอยที่เราเปรียบเทียบประสิทธิภาพของการพิจารณาโครงร่างพื้นฐาน cilk สี่ :( 1 ) เสมอ แบบที่มักจะ speculates เมื่อ sync คือจะถูกระงับโดยไม่ต้องอาศัยตัวแปร ; ( 2 )เปรตในขั้นตอนเดียว , เก็งกำไรตาม ) ; ( 3 )ลึก , โครงการการเก็งกําไรลึก ; และ ( 4 ) พารา , ขนานโครงการการคาดการณ์ หลังสามแบบได้แก่ล่าช้าที่เหมาะสมเท่านั้น เราอ้างอิงแต่ละแยกแบบ ทราบว่าโครงการด้วยตนเองรวม

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.