Modern graphics processing units (G

Modern graphics processing units (GPUs) include hardware-
controlled caches to reduce bandwidth requirements and en-
ergy consumption. However, current GPU cache hierarchies
are inecient for general purpose GPU (GPGPU) comput-
ing. GPGPU workloads tend to include data structures
that would not t in any reasonably sized caches, leading
to very low cache hit rates. This problem is exacerbated by
the design of current GPUs, which share small caches be-
tween many threads. Caching these streaming data struc-
tures needlessly burns power while evicting data that may
otherwise t into the cache.
We propose a GPU cache management technique to im-
prove the eciency of small GPU caches while further re-
ducing their power consumption. It adaptively bypasses the
GPU cache for blocks that are unlikely to be referenced again
before being evicted. This technique saves energy by avoid-
ing needless insertions and evictions while avoiding cache
pollution, resulting in better performance. We show that,
with a 16KB L1 data cache, dynamic bypassing achieves sim-
ilar performance to a double-sized L1 cache while reducing
energy consumption by 25% and power by 18%.
The technique is especially interesting for programs that
do not use programmer-managed scratchpad memories. We
give a case study to demonstrate the ineciency of current
GPU caches compared to programmer-managed scratchpad
memories and show the extent to which cache bypassing can
make up for the potential performance loss where the eort
to program scratchpad memories is impractica

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

สมัยกราฟิกประมวลผลหน่วย (GPUs) รวมฮาร์ดแวร์-ควบคุมการแคชเพื่อลดความต้องการแบนด์วิธและ en-ปริมาณการใช้ ergy อย่างไรก็ตาม GPU ปัจจุบันแคลำดับชั้นมี ine cient เพื่อวัตถุประสงค์ทั่วไป comput GPU (GPGPU) -ไอเอ็นจี GPGPU เวิร์กมักจะ มีโครงสร้างข้อมูลที่จะไม่ t ในแคชมีขนาดสม นำแคชมากตีราคา ปัญหานี้จะเลวร้ายด้วยมีการออกแบบของ GPUs ปัจจุบัน ที่ใช้แคชเล็ก-tween ในกระทู้ แคนี้สตรีมมิ่งข้อมูล struc-tures เผาพลังงานโดยไม่จำเป็นในขณะ evicting ข้อมูลที่อาจทีอย่างอื่นลงในแคชเราเสนอเทคนิคจัดการแคของ GPU กับ im-พิสูจน์ ciency อีของแคช GPU เล็กขณะต่อไป re-ducing พลังงานของพวกเขา ได้อย่างเหมาะเลี่ยงผ่านกระบวนการแค GPU สำหรับบล็อกที่ไม่น่าที่จะอ้างอิงอีกครั้งก่อนที่จะถูกเอาออก โดยหลีกเลี่ยงนี้เทคนิคช่วยประหยัดพลังงาน-กำลังจำเป็นแทรกและ evictions เลี่ยงแคมลภาวะ ในประสิทธิภาพที่ดีขึ้น เราแสดงที่กับแคข้อมูล 16KB L1 เลี่ยงแบบไดนามิกได้รับ sim-ilar ประสิทธิภาพการแคช L1 ขนาดใหญ่ลดการใช้พลังงาน โดยพลังงาน 18% และ 25%เทคนิคน่าสนใจโดยเฉพาะอย่างยิ่งสำหรับโปรแกรมที่ใช้ scratchpad โปรแกรมเมอร์จัดการความทรงจำ เราให้กรณีศึกษาส่อ ciency ine ของปัจจุบันแคช GPU เมื่อเทียบกับโปรแกรมเมอร์จัดการ scratchpadความทรงจำและแสดงขอบเขตการเลี่ยงแคที่สามารถจัดทำขึ้นสำหรับการสูญเสียประสิทธิภาพศักยภาพที่ ort อีการโปรแกรม scratchpad impractica เป็นความทรงจำ

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

โมเดิร์นหน่วยประมวลผลกราฟิก (GPU รุ่น)
รวมถึงฮาร์ดแวร์แคชควบคุมเพื่อลดความต้องการแบนด์วิดธ์และen-
บริโภค ergy อย่างไรก็ตาม GPU
ลำดับชั้นแคชปัจจุบันมีครับ? เพียงพอสำหรับ GPU ที่ใช้งานทั่วไป (GPGPU) comput-
ไอเอ็นจี ปริมาณงาน GPGPU
มีแนวโน้มที่จะรวมถึงโครงสร้างข้อมูลที่จะไม่t ในแคชขนาดเหมาะสมใด ๆ
ที่นำไปยังแคชที่ต่ำมากอัตราการตี ปัญหานี้จะเลวร้ายลงโดยการออกแบบของ GPUs ปัจจุบันซึ่งแบ่งปันแคชขนาดเล็กสลับกันทวีหลายกระทู้ แคชข้อมูลเหล่านี้สตรีมมิ่งโครงสร้างตูเรสไม่จำเป็นต้องเผาผลาญพลังงานในขณะที่ขี้บ่นข้อมูลที่อาจเป็นอย่างอื่นt เข้าแคช. เราเสนอเทคนิคการจัดการแคช GPU จะอิ่มพิสูจน์อี? ciency แคช GPU ขนาดเล็กในขณะที่ต่อไปอีกducing การใช้พลังงานของพวกเขา มันปรับเปลี่ยนทะลุแคช GPU สำหรับบล็อกที่ไม่น่าจะถูกอ้างถึงอีกครั้งก่อนที่จะถูกขับไล่ เทคนิคนี้ช่วยประหยัดพลังงานโดย avoid- ไอเอ็นจีแทรกความจำเป็นและขับไล่ขณะที่หลีกเลี่ยงแคชมลพิษส่งผลให้ประสิทธิภาพที่ดีขึ้น เราแสดงให้เห็นว่ามี 16KB L1 แคชข้อมูลแบบไดนามิกที่ประสบความสำเร็จในอ้อมซิมประสิทธิภาพILAR ไปยังแคช L1 คู่ขนาดในขณะที่ลดการใช้พลังงานลง25% และการใช้พลังงาน 18%. เทคนิคโดยเฉพาะอย่างยิ่งเป็นที่น่าสนใจสำหรับโปรแกรมที่ไม่ได้ใช้โปรแกรมเมอร์ความทรงจำที่ ScratchPad -managed เราให้กรณีศึกษาแสดงให้เห็นถึงครับ? ciency ของกระแสแคชGPU เมื่อเทียบกับการเขียนโปรแกรมที่มีการจัดการ ScratchPad ความทรงจำและแสดงขอบเขตที่อ้อมแคชสามารถทำขึ้นสำหรับการสูญเสียประสิทธิภาพการทำงานที่อาจเกิดขึ้นที่จ? ดื่มเกลือแร่ในการเขียนโปรแกรมเป็นความทรงจำที่ScratchPad impractica

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

หน่วยประมวลผลกราฟิก ( GPUs ) ที่ทันสมัยรวมถึงฮาร์ดแวร์ -
ควบคุมแคชเพื่อลดความต้องการแบนด์วิดธ์และ EN -
ไฟพลังงาน อย่างไรก็ตาม ปัจจุบัน GPU แคชลำดับชั้น
เป็น Ine cient สำหรับ GPU วัตถุประสงค์ทั่วไป ( gpgpu ) คอมพิวเตอร์ -
ไอเอ็นจี งาน gpgpu มักจะรวมถึงโครงสร้างข้อมูล
t ใด ๆที่จะไม่ พอสมควรขนาดแคชา
แคน้อยมากตีอัตรา ปัญหานี้เป็น exacerbated โดย
การออกแบบของ GPUs ในปัจจุบันซึ่งใช้แคชขนาดเล็ก -
นหลายกระทู้ แคชเหล่านี้สตรีมมิ่งข้อมูลโครงสร้าง -
ตูเรสต้องการเผาไหม้พลังงานในขณะที่บ่นข้อมูลที่อาจ
ไม่งั้น T ในแคช .
เราเสนอ GPU แคชการจัดการเทคนิคอิม -
พิสูจน์ประสิทธิภาพของ GPU และ แคชขนาดเล็กในขณะที่เพิ่มเติม Re -
ducing ของการใช้พลังงาน มันตามที่ข้าม
GPU แคชสำหรับบล็อกที่ไม่น่าจะอ้างอิงอีกครั้ง
ก่อนที่จะถูกขับไล่ เทคนิคนี้ช่วยประหยัดพลังงาน โดยหลีกเลี่ยง -
ไอเอ็นจีและไม่ใหม่ evictions ในขณะที่หลีกเลี่ยงการแคช
มลพิษส่งผลให้ประสิทธิภาพที่ดีขึ้น เราพบว่า 16kb แคช L1
กับข้อมูลแบบไดนามิกผ่านใช้ซิม -
ilar การปฏิบัติกับคู่ขนาด L1 แคชในขณะที่ลด
การใช้พลังงาน 25% และพลังงานโดยร้อยละ 18 .
) เป็นโปรแกรมที่น่าสนใจโดยเฉพาะอย่างยิ่งสำหรับ
ไม่ใช้โปรแกรมเมอร์จัดการความทรงจำ scratchpad . เรา
ให้กรณีศึกษาที่แสดงให้เห็นถึงประสิทธิภาพของแคช ine GPU ในปัจจุบัน
เมื่อเทียบกับโปรแกรมจัดการ scratchpad
ความทรงจำและแสดงขอบเขตที่แคชผ่านสามารถ
ชดเชยการสูญเสียศักยภาพในการปฏิบัติงานที่
e ส่งออกความทรงจำ scratchpad โปรแกรม impractica

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.