Since the combinations of optimizat

Since the combinations of optimizations result in seemingly
arbitrary performance benefits, we tested all combinations
and found that with OpenCL on AMD GPUs,
kernel splitting (KS) + register preloading (RP) + image
memory (IM) performs the best. Figure 7 presents
the speedup obtained on both AMD and NVIDIA GPUs
with OpenCL and CUDA, respectively. We compared the
unoptimized version as well as the one with architecturespecific
optimizations and found out that the unoptimized
CUDA implementation performs better than the unoptimized
OpenCL implementation. However, in the case of the optimized
version, OpenCL on AMD GPU is faster by 12% than
CUDA on its NVIDIA counterpart.

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

เนื่องจากชุดของเพิ่มประสิทธิภาพทำให้ดูเหมือนว่ากำหนดประสิทธิภาพประโยชน์ ที่เราทดสอบชุดทั้งหมดพบว่า มี OpenCL ใน AMD GPUsเมล็ดที่แบ่ง (KS) + ทะเบียน preloading (RP) + รูปหน่วยความจำ (IM) ทำดีสุด รูปที่ 7 แสดงspeedup ที่ได้ทั้ง AMD และ NVIDIA GPUsOpenCL และ CUDA ตามลำดับ เราเปรียบเทียบการรุ่น unoptimized เป็นหนึ่งกับ architecturespecificเพิ่มประสิทธิภาพ และพบว่าที่ unoptimizedใช้งาน CUDA ทำดีกว่าที่ unoptimizedOpenCL ดำเนินการ อย่างไรก็ตาม ในกรณีของการเพิ่มประสิทธิภาพรุ่น OpenCL ใน AMD GPU อยู่ 12% กว่าCUDA ของ NVIDIA กันบน

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

ตั้งแต่การรวมกันของการเพิ่มประสิทธิภาพทำให้ดูเหมือนว่า
ผลการดำเนินงานโดยพลประโยชน์เราได้ทดสอบรวมทั้งหมด
และพบว่ามี OpenCL บน AMD GPUs,
แยกเคอร์เนล (KS) + ลงทะเบียนพรีโหลด (RP) + ภาพ
หน่วยความจำ (IM) การดำเนินการที่ดีที่สุด รูปที่ 7 นำเสนอ
การเร่งความเร็วได้ทั้ง AMD และ NVIDIA GPUs
กับ OpenCL และ CUDA ตามลำดับ เราเมื่อเทียบกับ
รุ่นที่ไม่ได้เพิ่มประสิทธิภาพเช่นเดียวกับ architecturespecific
การเพิ่มประสิทธิภาพและพบว่าไม่ได้เพิ่มประสิทธิภาพ
การดำเนินงาน CUDA ประสิทธิภาพดีกว่าไม่ได้เพิ่มประสิทธิภาพ
การดำเนินงาน OpenCL อย่างไรก็ตามในกรณีที่มีการปรับ
รุ่น OpenCL บน GPU AMD จะเร็วขึ้น 12% กว่า
CUDA ในคู่ NVIDIA

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

เนื่องจากการรวมกันของการเพิ่มประสิทธิภาพผลปรากฏอยู่
พลประโยชน์สมรรถนะ เราทดสอบทุกชุด
และพบว่ากับ OpenCL บน AMD GPUs
เคอร์เนล , แยก ( KS ) ลงทะเบียนโหลดโปรแกรมล่วงหน้า ( preloading ) ( RP ) หน่วยความจำภาพ
( IM ) มีประสิทธิภาพดีที่สุด รูปที่ 7 แสดง
ได้ทั้ง AMD และ NVIDIA SpeedUp
กับ OpenCL CUDA GPUs และตามลำดับ เราเทียบ
unoptimized รุ่นรวมทั้งหนึ่งกับ architecturespecific
การเพิ่มประสิทธิภาพและพบว่า unoptimized
การดำเนินงานมีประสิทธิภาพดีกว่า unoptimized
OpenCL การดําเนินงาน อย่างไรก็ตาม ในเรื่องของการปรับรุ่นซอฟต์แวร์ (
, บน AMD GPU เร็วกว่า 12 %
CUDA ของ NVIDIA คู่

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.