First, the total run time of the pr

First, the total run time of the programs as a function of the total number of vertical columns (loop number) is compared. This run time is the total wall time of the execution and includes the non-accelerated code portions, memory copying operations and GPU initialization time. The run time was calculated for both versions of the code, at loop numbers of multiples of 256 (the number of CUDA cores) up to 4096. By the next power of two (8192) the GPU had insufficient memory to store all the variables. The results are shown in Fig. 3. From the run times, it is clear that parallelization was successful, as the slope of the run time curve vs. loop number is much less for the GPU code

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

ครั้งแรก รวมรันไทม์ของโปรแกรมเป็นฟังก์ชันของจำนวนคอลัมน์แนวตั้ง (หมายเลข loop) มีการเปรียบเทียบ เวลารันคือ เวลากำแพงของการดำเนินการ และรวมถึงเร่งไม่ใช่รหัสบางส่วน การดำเนินการคัดลอกหน่วยความจำ และเวลาการเตรียมใช้งาน GPU เวลาที่ใช้คำนวณรหัส ที่เลขห่วงของพหุคูณของ 256 (จำนวน CUDA cores) ทั้งสองรุ่นได้ถึง 4096 โดยพลังงานถัดไปสอง (8192) GPU มีหน่วยความจำไม่เพียงพอในการเก็บตัวแปร ผลลัพธ์จะแสดงในรูปที่ 3 จากเวลาที่ใช้ เป็นที่ชัดเจนว่า parallelization ประสบความสำเร็จ เป็นลาดโค้งเวลารันเจอห่วง เลขคือมากน้อยสำหรับรหัส GPU

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

ครั้งแรกที่เวลาทำงานทั้งหมดของโปรแกรมที่เป็นหน้าที่ของจำนวนเสียงทั้งหมดของคอลัมน์แนวตั้ง (หมายเลขห่วง) จะเทียบ เวลาทำงานนี้เป็นครั้งที่ผนังรวมของการดำเนินการและรวมถึงการไม่เร่งส่วนรหัสการดำเนินงานหน่วยความจำการคัดลอกและการเริ่มต้น GPU เวลา เวลาทำงานที่คำนวณได้สำหรับทั้งสองรุ่นของรหัสที่ตัวเลขห่วงทวีคูณของ 256 (จำนวนแกน CUDA) ที่สูงถึง 4096 โดยอำนาจต่อไปของสอง (8192) GPU มีหน่วยความจำไม่เพียงพอที่จะเก็บตัวแปรทั้งหมด ผลที่จะได้แสดงในรูป 3. จากการทำงานครั้งก็เป็นที่ชัดเจนว่าขนานก็ประสบความสำเร็จเช่นเดียวกับความลาดเอียงของเวลาทำงานโค้งเทียบกับจำนวนห่วงมากน้อยรหัสที่ GPU

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

แรก รวมใช้เวลาของโปรแกรมที่เป็นฟังก์ชันของจํานวนคอลัมน์แนวตั้ง ( ห่วงตัวเลข ) เปรียบเทียบ นี้ใช้เวลาทั้งหมดผนังเวลาของการประหารชีวิตและรวมถึงไม่เร่งรหัสส่วนหน่วยความจำคัดลอกการดำเนินงานและเวลาเริ่มต้นที่ GPU . วิ่ง เวลาคำนวณสำหรับทั้งสองรุ่นของรหัสที่ห่วงตัวเลขของหลาย ๆคน ( จำนวนของแกน CUDA ) ถึง 4096 . ด้วยพลังอีกสอง ( 8192 ) GPU มีหน่วยความจำไม่เพียงพอในการจัดเก็บตัวแปรทั้งหมด ผลลัพธ์ที่แสดงในรูปที่ 3 จากวิ่งครั้ง , เป็นที่ชัดเจนว่า parallelization ไปประสบความสำเร็จ ตามความชันของเส้นโค้งและเรียกเวลาห่วงตัวเลขมากน้อยสำหรับ GPU รหัส

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.