The Naive implementation reads nine

The Naive implementation reads nine input pixels and
writes one output pixel from/to off-chip memory. Threads
are organized in blocks of 16 by 16. This implementation
only exploits the possible locality of the input pixels within
the 16×16 block. In the other implementations, threads
are organized in a vector 512 long, matching the width of
the image. Since there are 14 SMs in the GPU used, each
thread block processes a chunk of 36 or 37 (512/14) lines in
the image, such that previously loaded lines can be re-used.
In the By line implementations this re-use is achieved by
relying on the L1 cache in each SM. In the Shared memory
implementations the re-use is manually managed by loading
rows of the image in the shared memory in the SM. The third
and fifth implementation (annotated with (R)) use an extra
level of re-use by keeping previously loaded lines in registers.
All of these implementations, except Naive, outperform the
NVIDIA CUDA SDK implementations of 2D convolution.

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

ใช้ Naive อ่านเก้าเข้าพิกเซล และเขียนยกออกจาก/ไปยังหน่วยความจำออกจากชิพ หัวข้อมีการจัดระเบียบในช่วง 16 จาก 16 ใช้งานนี้นำท้องถิ่นได้พิกเซลสำหรับการป้อนค่าภายในเท่านั้นตาราง 16 การบล็อก 16 กระทู้ในที่อื่น ๆ ใช้งานมีการจัดระเบียบในเวกเตอร์ 512 ยาว ความกว้างของการจับคู่ภาพ เนื่องจากมี 14 SMs ใน GPU ที่ ใช้ แต่ละท่อ 36 หรือ 37 บรรทัด (512/14) ในกระบวนการบล็อกหัวข้อรูป เช่นที่ก่อนหน้านี้ โหลดบรรทัดสามารถใช้ใหม่ในการใช้งานบรรทัด By ใช้นี้ใหม่สามารถทำได้โดยพึ่งแคช L1 ใน SM แต่ละ ในหน่วยความจำที่ใช้ร่วมกันใช้แบบใหม่เป็นจัดการด้วยตนเอง โดยโหลดใช้งานแถวของรูปในหน่วยความจำที่ใช้ร่วมกันในการ SM ที่สามและงานที่ห้า (ใส่คำอธิบายประกอบกับ (R)) ใช้เพิ่มเติมระดับของใหม่ใช้รักษาก่อนหน้านี้โหลดรายการในทะเบียนทั้งหมดของการใช้งานเหล่านี้ ยกเว้น Naive มีประสิทธิภาพสูงกว่าการใช้งาน NVIDIA CUDA SDK ของ 2D convolution

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

การดำเนินงานที่ไร้เดียงสาอ่านเก้าพิกเซลการป้อนข้อมูลและเขียนพิกเซลผลผลิตหนึ่งจาก / ไปยังหน่วยความจำออกชิป
หัวข้อที่ถูกจัดอยู่ในกลุ่มของ 16 16. การดำเนินการนี้เท่านั้นที่ใช้ประโยชน์จากท้องที่เป็นไปได้ของการป้อนข้อมูลพิกเซลภายใน16 × 16 บล็อก ในการใช้งานอื่น ๆ ที่กระทู้ถูกจัดอยู่ในเวกเตอร์512 ยาวที่ตรงกับความกว้างของภาพ เนื่องจากมี 14 SMS ใน GPU ที่ใช้ในแต่ละบล็อกด้ายกระบวนการก้อน36 หรือ 37 (512/14) บรรทัดในภาพดังกล่าวว่าสายโหลดก่อนหน้านี้สามารถกลับมาใช้ใหม่. ในการใช้งานตามเส้นนี้กลับมาใช้จะทำได้โดยอาศัยแคช L1 ในแต่ละเอสเอ็ม ในหน่วยความจำที่ใช้ร่วมกันการใช้งานกลับมาใช้มีการจัดการด้วยตนเองโดยการโหลดแถวของภาพในหน่วยความจำที่ใช้ร่วมกันในเอสเอ็ม ที่สามการดำเนินงานและห้า (ข้อเขียนด้วย (R)) ใช้เพิ่มระดับของการกลับมาใช้โดยการรักษาวงเงินเต็มไปก่อนหน้านี้ในการลงทะเบียน. ทั้งหมดของการใช้งานเหล่านี้ยกเว้นหน่อมแน้ม, ดีกว่าNVIDIA CUDA การใช้ SDK ของบิด 2D

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

การป้อนข้อมูลพิกเซลและไร้เดียงสา อ่านว่า เก้า
เขียนหนึ่งพิกเซลแสดงผลจาก / ไปยังออกชิปหน่วยความจำ . กระทู้
จัดในบล็อก 16 จาก 16 การใช้ประโยชน์จากส่วนนี้
เท่านั้นที่เป็นไปได้ของการป้อนข้อมูลพิกเซลภายใน
16 × 16 บล็อก ในการใช้งานอื่น ๆกระทู้
จัดในเวกเตอร์ 512 ยาวตรงกับความกว้างของ
ภาพ ตั้งแต่มี 14 SMS ในแต่ละ
GPU ที่ใช้หัวข้อบล็อกกระบวนการก้อน 36 หรือ 37 ( 512 / 14 ) สายใน
ภาพ เช่น เส้นสามารถโหลดก่อนหน้านี้อีกครั้งใช้ .
ในเส้นใช้งานนี้ได้โดย
อาศัยแคช L1 ในแต่ละ SM ในหน่วยความจำที่ใช้ร่วมกันที่ใช้งานได้ด้วยตนเอง

แถวโดยการโหลดภาพในหน่วยความจำที่ใช้ร่วมกันใน SM 3
5 การใช้บันทึกย่อ ( R ) ) ใช้เพิ่มระดับของการใช้โดยการโหลดก่อนหน้านี้

สายระเบียน ทั้งหมดของงานเหล่านี้ ยกเว้น ไร้เดียงสา มีประสิทธิภาพสูงกว่า
NVIDIA CUDA SDK ใช้ 2D ขด .

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.