8. ConclusionsAs GPGPUs can issue 1

8. Conclusions
As GPGPUs can issue 100s of per-lane instructions per cycle, supporting address translation appears formidable. Our analysis, however, shows that a non-exotic GPU MMU design performs well with commonly-used 4 KB pages: per-CU post-coalescer TLBs, a shared 32-way highly-threaded page table walker, and a shared page walk cache. We focused on the x86-64 ISA in this work. However, our findings generalize to any ISA with a hardware walked and tree-based page table structure. The proof-of-concept GPU MMU design analyzed in this paper shows that decreasing the complexity of programming the GPU without incurring significant overheads is possible, opening the door to novel heterogeneous workloads.

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

8. บทสรุปเป็น GPGPUs สามารถออก 100s ของคำแนะนำต่อเลนต่อวงจร สนับสนุนแปลอยู่แล้วน่ากลัว การวิเคราะห์ของเรา อย่างไรก็ตาม แสดงว่า แบบ GPU MMU เอ็กโซติกไม่ทำดีกับใช้บ่อยหน้า 4 KB: coalescer หลังต่อ CU TLBs ที่ร่วมทาง 32 เธรดสูงหน้าตารางวอล์คเกอร์ และหน้าร่วมเดินแคช เราเน้น ISA x 86-64 ในงานนี้ อย่างไรก็ตาม เราค้นพบเมการ ISA ใด ๆ ฮาร์ดแวร์เดินและต้นไม้หน้าตารางโครงสร้าง แบบ GPU MMU หลักของแนวคิดที่วิเคราะห์ในเอกสารนี้แสดงว่า การลดความซับซ้อนของการเขียนโปรแกรม GPU สำคัญวัสดุดังกล่าวเป็นไปได้ เปิดประตูสู่เวิร์กนวนิยายแตกต่างกัน

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

8. สรุปผลการวิจัย
ในฐานะที่เป็น GPGPUs สามารถออก 100s ของคำสั่งต่อเลนต่อวงจรสนับสนุนการแปลที่อยู่ปรากฏขึ้นที่น่ากลัว การวิเคราะห์ของเรา แต่แสดงให้เห็นว่า GPU ที่ไม่แปลกใหม่ออกแบบ MMU ดำเนินการได้ดีกับที่ใช้กันทั่วไป 4 หน้า KB: ต่อ-CU TLBs โพสต์ตัวกลาง, ร่วมกัน 32 วิธีสูงเธรดวอล์คเกอร์โต๊ะหน้าและแคชเดินหน้าร่วมกัน . เรามุ่งเน้น ISA x86-64 ในงานนี้ อย่างไรก็ตามผลการวิจัยของเราที่จะพูดคุย ISA กับฮาร์ดแวร์ใด ๆ เดินและต้นไม้ตามโครงสร้างตารางหน้า การออกแบบหลักฐานของแนวคิด GPU MMU วิเคราะห์ในบทความนี้แสดงให้เห็นว่าการลดความซับซ้อนของการเขียนโปรแกรม GPU โดยไม่ต้องเสียค่าใช้จ่ายอย่างมีนัยสำคัญเป็นไปได้เปิดประตูให้ปริมาณงานที่แตกต่างนวนิยาย

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

8 . สรุป
เป็น gpgpus สามารถออก 100s ของต่อเลนคำสั่งต่อรอบ สนับสนุนการแปลที่อยู่ปรากฏที่น่ากลัว การวิเคราะห์ของเรา อย่างไรก็ตาม แสดงว่าไม่รับออกแบบแปลกใหม่ GPU มีประสิทธิภาพดีด้วย ปกติจะใช้ 4 KB หน้า : ต่อทองแดงหลังตัวกลางแบบ tlbs , แบ่งปัน 32 วิธีสูงเกลียวหน้าโต๊ะ วอล์คเกอร์ และ ที่เดินหน้าแคช เราเน้น WYSIWYG ซึ่งในงานนี้ อย่างไรก็ตามการค้นพบของเราลงความเห็นใด ISA กับฮาร์ดแวร์เดินและโครงสร้างหน้าโต๊ะตามต้นไม้ หลักฐานของแนวคิดการออกแบบ GPU รับวิเคราะห์ในงานวิจัยนี้แสดงให้เห็นว่าการลดความซับซ้อนของการเขียนโปรแกรม GPU โดยไม่ก่อให้เกิดอย่างมีนัยสำคัญเมื่อเป็นไปได้ เปิดประตูให้นวนิยายต่างกันเวิร์กโหลด

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.