Conventional image processing techn

Conventional image processing techniques do not take
advantage of the available computing resources such as
multicore/manycore programming and become very time
intensive. GPU-based parallel computing has potential to
process large image files very fast. In this work, the impact of
CUDA-accelerated GPU computing on image processing
performance is studied. Image processing and filtering through
sequential C and parallel CUDA/C programs are implemented.
Six image files with sizes from 512x512 pixels to
16,384x16,384 pixels are considered. CUDA Events are used
to measure the GPU execution time.

According to the experimental results, image processing
and filtering is more efficient when done through CUDA
programming. This is because computations are done
concurrently in parallel by fully exploiting the available
processing resources to improve speedup. Considering the
matrix manipulation on GPU in this experiment, speedup up to
365x can be achieved for a 16,384x16,384-pixel image.

It should be noted that there is a considerable overhead
caused by the CUDA copy operation between the host and the
devices that may reduce the speedup. It is observed that the
overhead due to the additional CUDA operations is
considerable compared to the actual pixels manipulation. For
large images, the CUDA malloc() time may be neglected, but
the time to copy data from/to CPU to/from GPU significantly
impacts on the overall performance.

Future extensions of this work include considering more
complex filters that may require thread cooperation to handle
data dependency in order to improve CUDA performance.

According to the experimental results, image processing
and filtering is more efficient when done through CUDA
programming. This is because computations are done
concurrently in parallel by fully exploiting the available
processing resources to improve speedup. Considering the
matrix manipulation on GPU in this experiment, speedup up to
365x can be achieved for a 16,384x16,384-pixel image.

It should be noted that there is a considerable overhead
caused by the CUDA copy operation between the host and the
devices that may reduce the speedup. It is observed that the
overhead due to the additional CUDA operations is
considerable compared to the actual pixels manipulation. For
large images, the CUDA malloc() time may be neglected, but
the time to copy data from/to CPU to/from GPU significantly
impacts on the overall performance.

Future extensions of this work include considering more
complex filters that may require thread cooperation to handle
data dependency in order to improve CUDA performance.

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

ไม่มีใช้เทคนิคการประมวลผลภาพแบบเดิมประโยชน์ของทรัพยากรคอมพิวเตอร์ใช้เช่นmulticore/manycore เป็น เวลามาก และการเขียนโปรแกรมเร่งรัดการ ใช้ GPU คอมพิวเตอร์แบบขนานมีศักยภาพในการประมวลผลไฟล์รูปภาพขนาดใหญ่อย่างรวดเร็ว ในงานนี้ ผลกระทบของคอมพิวเตอร์ในการประมวลผลภาพ GPU เร่ง CUDAเป็นศึกษาประสิทธิภาพ การประมวลผลภาพและการกรองผ่านมีใช้โปรแกรม CUDA/C ขนานและ C ตามลำดับ6 ภาพแฟ้มที่ มีขนาดตั้งแต่ 512 x 512 พิกเซลเพื่อ16, 384 x 16, 384 พิกเซลถือว่า ใช้ CUDA เหตุการณ์การวัดเวลาการประมวลผล GPU ตามผลการทดลอง การประมวลผลภาพและกรองมีประสิทธิภาพมากขึ้นเมื่อทำผ่าน CUDAเขียนโปรแกรม ทั้งนี้เนื่องจากทำการประมวลผลพร้อมในขนานโดย exploiting เต็มที่มีทรัพยากรการประมวลผลเพื่อปรับปรุง speedup พิจารณาจัดการเมตริกซ์บน GPU นี้ทดลอง speedup ถึงสามารถทำได้สำหรับ 16, 365 x 384 x 16, 384 พิกเซลภาพ ควรสังเกตว่า มีค่าโสหุ้ยมากเกิดจาก CUDA คัดลอกระหว่างโฮสต์และอุปกรณ์ที่อาจลดการ speedup จะสังเกตที่การโสหุ้ยการผลิตเนื่องจากการดำเนินงานเพิ่มเติมของ CUDA เป็นมากเมื่อเทียบกับการพิกเซลจริง สำหรับภาพขนาดใหญ่ เมื่อ malloc() CUDA อาจจะที่ไม่มีกิจกรรม แต่เวลาที่จะคัดลอกข้อมูล จาก/CPU/GPU จากมากผลกระทบต่อประสิทธิภาพโดยรวม ส่วนขยายในอนาคตของงานนี้มีการพิจารณาเพิ่มเติมตัวกรองที่ซับซ้อนซึ่งอาจทำให้หัวข้อความร่วมมือในการจัดการอ้างอิงข้อมูลเพื่อปรับปรุงประสิทธิภาพการทำงานของ CUDA

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

เทคนิคการประมวลผลภาพทั่วไปไม่ได้ใช้ประโยชน์จากทรัพยากรคอมพิวเตอร์ที่สามารถใช้ได้เช่น
multicore / การเขียนโปรแกรม manycore
และเป็นเวลานานมากที่เข้มข้น GPU
ที่ใช้การคำนวณแบบขนานมีศักยภาพในการประมวลผลไฟล์ภาพขนาดใหญ่ได้อย่างรวดเร็วมาก ในงานนี้ผลกระทบของการใช้คอมพิวเตอร์ CUDA GPU เร่งในการประมวลผลภาพประสิทธิภาพคือการศึกษา การประมวลผลภาพและการกรองผ่านลำดับซีและขนาน CUDA โปรแกรม / C จะดำเนินการ. หกไฟล์ภาพที่มีขนาดตั้งแต่ 512x512 พิกเซล16,384x16,384 พิกเซลได้รับการพิจารณา เหตุการณ์ CUDA ถูกนำมาใช้ในการวัดเวลาปฏิบัติการของ GPU. ตามผลการทดลองการประมวลผลภาพและการกรองที่มีประสิทธิภาพมากขึ้นเมื่อทำผ่าน CUDA การเขียนโปรแกรม นี้เป็นเพราะการคำนวณจะทำควบคู่กันไปในแบบคู่ขนานโดยการใช้ประโยชน์อย่างเต็มที่ที่มีทรัพยากรการประมวลผลเพื่อปรับปรุงเพิ่มความเร็ว พิจารณาการจัดการเมทริกซ์ใน GPU ในการทดลองนี้ speedup ถึง 365x สามารถทำได้สำหรับภาพ 16,384x16,384 พิกเซล. มันควรจะตั้งข้อสังเกตว่ามีค่าใช้จ่ายเป็นจำนวนมากที่เกิดจากการดำเนินการคัดลอก CUDA ระหว่างโฮสต์และอุปกรณ์ที่อาจลด speedup มันเป็นที่สังเกตว่าค่าใช้จ่ายที่เกิดจากการดำเนินงาน CUDA เพิ่มเติมมากเมื่อเทียบกับการจัดการพิกเซลที่เกิดขึ้นจริง สำหรับภาพขนาดใหญ่ malloc CUDA () เวลาอาจจะละเลย แต่เวลาในการคัดลอกข้อมูลจาก/ ไปยัง CPU / จาก GPU อย่างมีนัยสำคัญส่งผลกระทบต่อประสิทธิภาพการทำงานโดยรวม. ส่วนขยายในอนาคตของงานนี้รวมถึงการพิจารณามากขึ้นตัวกรองที่ซับซ้อนที่อาจต้องใช้ความร่วมมือกระทู้ที่จะจัดการกับการพึ่งพาข้อมูลเพื่อปรับปรุงประสิทธิภาพการทำงาน CUDA

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.