6. CONCLUSIONS & FUTURE WORKIn this

6. CONCLUSIONS & FUTURE WORK
In this paper we proposed the GPU-CC architecture, adding
an extra mode of computation to contemporary GPU
architectures to better utilize its computational resources.
By configuring the cores of a GPU in a network with direct
Table 1: Performance of five versions of 2D convolution
(3×3) for a 512×512 image on an NVIDIA
GTX 470 and on the GPU-CC architecture.
Version Performance Speed-up
Naive 3.5 Gpixels/s 1.0
By line 6.4 Gpixels/s 1.8
By line (R) 7.8 Gpixels/s 2.2
Shared memory 4.7 Gpixels/s 1.3
Shared memory (R) 4.7 Gpixels/s 1.3
GPU-CC 14.8 Gpixels/s 4.2
communication, performance is improved (1.9× and 2.4×
for the 3×3 and 5×5 convolution example) while instruction
fetch and decode count is reduced significantly, resulting in
a reduced power consumption of an estimated 12%, at the
cost of an extra 12.4% of memory space on the GPU.
In future work we plan a more thorough analysis of the
FIFO buffer sizes, the number of data lanes and possibly
other interconnect topologies for the GPU-CC architecture.
We also plan to quantify the energy consumption benefits using
GPGPU-Sim’s power model [4]. Furthermore, we plan to
improve the programmability and experiment with a range
of applications, including applications which require more
instructions than the number of cores available.

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

6. สรุปและทำงานในอนาคตในเอกสารนี้ เรานำเสนอสถาปัตยกรรม GPU CC เพิ่มโหมดการเพิ่มการคำนวณกับ GPU ที่ร่วมสมัยสถาปัตยกรรมเพื่อใช้ทรัพยากรของคอมพิวเตอร์โดยการกำหนดค่าแกนของ GPU ที่ในเครือข่ายโดยตรงตารางที่ 1: ประสิทธิภาพ 2D convolution รุ่นห้า(3 × 3) สำหรับ 512 × 512 ภาพบนเป็น NVIDIAGTX 470 และสถาปัตยกรรม GPU CCเร่งประสิทธิภาพการทำงานของรุ่นNaive 3.5 Gpixels/s 1.0โดยเส้น Gpixels 6.4 s 1.8บรรทัด (R) 7.8 Gpixels/s 2.24.7 หน่วยความจำที่ใช้ร่วมกัน Gpixels s 1.3(R) 4.7 หน่วยความจำที่ใช้ร่วมกัน Gpixels s 1.3GPU-CC 14.8 Gpixels/s 4.2การสื่อสาร ประสิทธิภาพการทำงานเป็น (1.9 ×และตารางที่ 2.4ตัวอย่าง convolution 3 × 3 และ 5 × 5) ในขณะที่คำสั่งนำมาใช้ และการถอดรหัสนับลดลงอย่างมาก ในการลดการใช้พลังงานที่ประมาณ 12% ในการต้นทุนของ% 12.4 การเพิ่มพื้นที่หน่วยความจำบน GPUทำงานในอนาคตเราวางแผนการวิเคราะห์อย่างละเอียดมากขึ้นของการขนาดบัฟเฟอร์การ FIFO จำนวนข้อมูลถนนหนทาง และอาจอื่น ๆ เชื่อมโทสำหรับสถาปัตยกรรม GPU CCเราวางแผนเพื่อกำหนดปริมาณพลังงานปริมาณการใช้ประโยชน์โดยใช้จำลองการใช้พลังงาน GPGPU Sim [4] นอกจากนี้ เราจะโปรแกรมการปรับปรุง และทดลองด้วยโปรแกรมประยุกต์ รวมถึงโปรแกรมประยุกต์ที่ต้องการเพิ่มเติมคำแนะนำมากกว่าจำนวนของแกนที่ใช้

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

6.
สรุปและการทำงานในอนาคตในบทความนี้เรานำเสนอสถาปัตยกรรมGPU-CC
เพิ่มโหมดพิเศษของการคำนวณกับGPU
ร่วมสมัยสถาปัตยกรรมที่ดีกว่าการใช้ทรัพยากรคอมพิวเตอร์ของ.
โดยการกำหนดค่าของแกน GPU
ในเครือข่ายที่มีโดยตรงตารางที่1: ผลการดำเนินงาน ห้ารุ่นบิด 2D
(3 × 3) สำหรับ 512 × 512 ภาพบน NVIDIA
GTX 470 และสถาปัตยกรรม GPU-CC.
รุ่นความเร็วขึ้นผลงานของผู้ไร้เดียงสา 3.5 Gpixels / s 1.0 โดยสาย 6.4 Gpixels / s 1.8 ตามสาย (R) 7.8 Gpixels / s 2.2 หน่วยความจำที่ใช้ร่วมกัน 4.7 Gpixels / s 1.3 หน่วยความจำที่ใช้ร่วมกัน (R) 4.7 Gpixels / s 1.3 GPU-CC 14.8 Gpixels / s 4.2 การสื่อสารที่มีประสิทธิภาพที่ดีขึ้น (1.9 × 2.4 ×สำหรับ3 × 3 5 × 5 ตัวอย่างเช่นบิด) ในขณะที่การเรียนการสอนสามารถดึงข้อมูลและจำนวนถอดรหัสจะลดลงอย่างมีนัยสำคัญส่งผลให้การใช้พลังงานที่ลดลงจากประมาณ12% ที่ค่าใช้จ่ายของเพิ่ม12.4% ของพื้นที่หน่วยความจำบนของ GPU. ในการทำงานในอนาคตเราวางแผนมากขึ้น การวิเคราะห์อย่างละเอียดของขนาดบัฟเฟอร์FIFO จำนวนเลนข้อมูลและอาจจะเป็นโครงสร้างการเชื่อมต่ออื่นๆ สำหรับสถาปัตยกรรม GPU-CC. เรายังวางแผนที่จะหาจำนวนผลประโยชน์การใช้พลังงานโดยใช้รูปแบบการใช้พลังงาน GPGPU ซิมของ [4] นอกจากนี้เราวางแผนที่จะปรับปรุงโปรแกรมและการทดสอบที่มีช่วงของการใช้งานรวมถึงการใช้งานที่จำเป็นต้องมีคำแนะนำมากกว่าจำนวนของแกนที่มีอยู่

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

6 . สรุป&ในอนาคต
ในกระดาษนี้เราเสนอ gpu-cc สถาปัตยกรรมการเพิ่มโหมดพิเศษของการคำนวณให้

ร่วมสมัยสถาปัตยกรรม GPU ที่ดีในการใช้ประโยชน์จากทรัพยากรการคำนวณของ .
โดยการกำหนดค่าแกนของ GPU ในเครือข่ายโดยตรง ตารางที่ 1 : แสดง
5 รุ่น 2 ขด
( 3 × 3 ) 512 × 512 ภาพบน NVIDIA GTX 470 ต่อ

gpu-cc สถาปัตยกรรมรุ่นประสิทธิภาพความเร็วขึ้น

gpixels ไร้เดียงสา 3.5 / s สำหรับเส้น 6.4 gpixels / S 1.8
โดยบรรทัด ( R ) 7.8 gpixels / S 2.2
หน่วยความจำที่ใช้ร่วมกัน gpixels 4.7 / s 1.3
หน่วยความจำที่ใช้ร่วมกัน ( R ) 4.7 gpixels / S 1.3
gpu-cc 14.8 gpixels / s 4.2
การสื่อสาร ประสิทธิภาพจะดีขึ้น ( 1.9 2.4 ×× 3 × 3
สำหรับ 5 ×เช่น 5 ขด ) ในขณะที่การเรียนการสอน
รับและถอดรหัสนับจะลดลงอย่างมาก ส่งผลให้
ลดการใช้พลังงานของประมาณ 12% ที่
ต้นทุนเพิ่มขึ้น 12.4% ของพื้นที่หน่วยความจำบน GPU .
ในการทำงานในอนาคตเราวางแผน การวิเคราะห์อย่างละเอียดของ
FIFO buffer ขนาด จำนวนของเส้นทางข้อมูลและอาจจะอื่นๆ ( topologies สำหรับ gpu-cc

เรายังวางแผนสถาปัตยกรรม ปริมาณการใช้พลังงาน ประโยชน์ใช้เป็นซิมแบบ gpgpu
ใช้ [ 4 ] นอกจากนี้ เราวางแผนที่จะ
ปรับปรุง programmability และทดลองกับช่วง
การใช้งานรวมถึงการใช้งานที่ต้องการคำแนะนำเพิ่มเติม
กว่าจำนวนของแกนของ .

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.