One way of achieving that is by red

One way of achieving that is by reducing the number of registers utilized per thread as more registers
means fewer threads in the kernel. However, AMD GPUs
have four times as many registers as equivalent NVIDIA
GPUs, and hence, one may use them more freely on AMD
GPUs. We achieved superior performance on the AMD GPU
by explicitly using extra registers in our GEM kernel. GEM
involves accumulating the potential at the vertex due to each
atom in the molecule. Rather than updating the intermediate
result in global memory for each atom, we make use of
a register accumulator and obtain a 1.3-fold speedup, as
shown in Figure 5. Using registers to preload data from
global memory is also useful. Preloading provides up to
a 1.6-fold speedup, also shown in Figure 5. The kernel
uses a small set of data repeatedly throughout the execution
of the kernel; preloading this data into a register rather
than reading from global memory delivers a substantial
performance benefit.

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

วิธีหนึ่งของการบรรลุเป้าหมายที่จะลดจำนวนลงทะเบียนที่ใช้สำหรับแต่ละหัวข้อลงทะเบียนเพิ่มขึ้นหมายถึง น้อยกว่ากระทู้ในเคอร์เนล อย่างไรก็ตาม AMD GPUsมีทะเบียนสี่ครั้งเป็นจำนวนมากเป็น NVIDIA เท่าGPUs และด้วยเหตุนี้ หนึ่งอาจใช้ได้อย่างอิสระมากขึ้นใน AMDGPUs เราบรรลุประสิทธิภาพบน AMD GPUโดยชัดเจนพิเศษลงทะเบียนในเคอร์เนลของเราพลอย พลอยเกี่ยวข้องกับศักยภาพที่จุดเนื่องจากแต่ละหลังอะตอมในโมเลกุล แทนที่ปรับปรุงในระดับปานกลางผลในหน่วยความจำส่วนกลางสำหรับแต่ละอะตอม เราให้ใช้สะสมทะเบียน และขอรับ 1.3-fold speedup เป็นแสดงในรูปที่ 5 ใช้การลงทะเบียนให้ข้อมูลหน่วยความจำส่วนกลางยังเป็นประโยชน์ แสดงการโหลดล่วงหน้าถึงการ 1.6-fold speedup แสดงในรูปที่ 5 เคอร์เนลใช้ชุดเล็กของข้อมูลซ้ำ ๆ ตลอดการดำเนินการของเคอร์เนล preloading ข้อมูลลงทะเบียนค่อนข้างกว่าการอ่านจากหน่วยความจำระดับโลกให้ความสำคัญประโยชน์ของประสิทธิภาพการทำงาน

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

บรรลุที่เป็นโดยการลดจำนวนของระเบียนที่ใช้ต่อด้ายเป็นรีจิสเตอร์
หมายถึงกระทู้น้อยลงในเคอร์เนล หนึ่งวิธี แต่ AMD GPUs
ได้เป็น 4 เท่า ลงทะเบียนเป็นเทียบเท่า NVIDIA GPUs
และดังนั้นหนึ่งสามารถใช้พวกเขาได้อย่างอิสระมากขึ้นซึ่ง
GPUs . เราบรรลุประสิทธิภาพที่เหนือกว่าบน AMD GPU
โดยใช้รีจิสเตอร์พิเศษในเคอร์เนลอย่างชัดเจนอัญมณีของเรา อัญมณี
ศักยภาพที่เกี่ยวข้องกับการสะสมยอด เนื่องจากแต่ละ
อะตอมในโมเลกุล แทนที่จะปรับปรุงผลปานกลาง
ในหน่วยความจำระดับโลกสำหรับแต่ละอะตอมที่เราใช้ลงทะเบียนสะสมและขอรับ

1.3-fold SpeedUp ตามที่แสดงในรูปที่ 5 ที่ใช้ลงทะเบียนเพื่อโหลดข้อมูลจากหน่วยความจำระดับโลก
ยังประโยชน์ โหลดโปรแกรมล่วงหน้า ( preloading ) แสดงถึงการ 1.6-fold สปีดอัพ ยัง แสดงในรูปที่ 5เคอร์เนล
ใช้ชุดขนาดเล็กของข้อมูลซ้ำ ๆตลอดการ
ของเมล็ด ; โหลดโปรแกรมล่วงหน้า ( preloading ) ข้อมูลนี้ในการลงทะเบียนค่อนข้างมากกว่าอ่านจากหน่วยความจำระดับโลก
มอบประโยชน์ประสิทธิภาพมาก

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.