Ultimately most of the code, with t

Ultimately most of the code, with the exception of a few calculations such as the one described the previous paragraph, was fully parallelized across multiple dimensions. The frist was the grid box dimension, the all calculations were parallelized across this dimension. The second was horizontal layers, which was set to 101. The third was wavenumber, which was set to 360. Finally, a data region directive was added for the PGI Accelerator, instructing it on what data needs to be copied in, copied out, and locally allocated on the GPU. Doing this explicitly is important because otherwise the code will spend considerable time doing unnecessary memory copying operations. After completing these development efforts, the PGI Accelerator produces a GPU kernel. The compiler produces information regarding the kernels it has compiled which should be checked to make sure each section of loops was fully parallelized across as many possible dimensions. Once the desired results are obtained for the compiler timing tests comparing the CPU code to the GPU code can begin. A flow chart illustrating the major steps in this porting process is shown in Fig. 2.

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

สุด ของรหัส ยกเว้นการคำนวณกี่เช่นที่อธิบายไว้ที่ย่อหน้าก่อนหน้า แก้ไขเต็มมความข้ามหลายมิติ หลังการแก้ไขมิติกล่องตาราง การคำนวณทั้งหมดที่มความข้ามมิตินี้ ที่สองคือ ชั้นแนวนอน ซึ่งถูกตั้งค่าให้ 101 ที่สามคือ wavenumber ซึ่งจะ 360 ในที่สุด ถูกคำสั่งเขตข้อมูลสำหรับตัวเร่ง PGI สอนบนข้อมูลที่จำเป็นจะถูกคัดลอกใน คัดออก และภายในการปันส่วน GPU การทำเช่นนี้อย่างชัดเจนเป็นสิ่งสำคัญ เพราะมิฉะนั้น รหัสจะใช้จ่ายมากเวลาทำหน่วยความจำที่ไม่จำเป็นในการคัดลอกการดำเนินงาน หลังจากความพยายามเหล่านี้พัฒนา เร่ง PGI สร้างตัวเคอร์เนล GPU คอมไพเลอร์สร้างข้อมูลเกี่ยวกับเมล็ดมันได้รวบรวมซึ่งควรตรวจสอบให้แน่ใจว่า แต่ละส่วนของลูปได้เต็มมความข้ามมิติได้มาก เมื่อได้ผลลัพธ์ต้องการสำหรับการกำหนดเวลาการทดสอบ เปรียบเทียบรหัส CPU GPU รหัสสามารถเริ่มต้น แผนภูมิการไหลที่แสดงขั้นตอนสำคัญในกระบวนการ porting นี้จะแสดงในรูป 2

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

ในท้ายที่สุดส่วนใหญ่ของรหัสที่มีข้อยกเว้นของไม่กี่คำนวณเช่นเดียวที่อธิบายวรรคก่อนหน้านี้ได้รับการ parallelized อย่างเต็มที่ในหลายมิติ เฟิเป็นมิติกล่องตารางการคำนวณทั้งหมดถูก parallelized ข้ามมิตินี้ ข้อที่สองคือชั้นในแนวนอนซึ่งถูกกำหนดให้ 101 ที่สามคือ wavenumber ซึ่งถูกกำหนดให้ 360 สุดท้ายสั่งเขตข้อมูลที่ถูกเพิ่มเข้ามาสำหรับ PGI เร่งสอนไว้ในข้อมูลที่จะต้องมีการคัดลอกในคัดลอกออก และการจัดสรรไว้ในที่ GPU การทำเช่นนี้อย่างชัดเจนเป็นสิ่งสำคัญเพราะมิฉะนั้นรหัสจะใช้เวลามากทำการดำเนินการคัดลอกหน่วยความจำที่ไม่จำเป็น หลังจากเสร็จสิ้นการพยายามในการพัฒนาเหล่านี้ PGI เร่งผลิตเมล็ด GPU เรียบเรียงข้อมูลเกี่ยวกับการผลิตเมล็ดมันได้รวบรวมซึ่งควรจะมีการตรวจสอบเพื่อให้แน่ใจว่าส่วนของลูปแต่ละคนอย่างเต็มที่ parallelized ข้ามมิติที่เป็นไปได้มากที่สุดเท่าที่ เมื่อผลลัพธ์ที่ต้องการจะได้รับสำหรับการทดสอบระยะเวลาคอมไพเลอร์เปรียบเทียบรหัสซีพียูรหัส GPU สามารถเริ่มต้น แผนภูมิการไหลแสดงขั้นตอนที่สำคัญในกระบวนการย้ายนี้จะแสดงในรูป 2

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

มากที่สุดของรหัสด้วยข้อยกเว้นของไม่กี่คํานวณ เช่นหนึ่งอธิบายย่อหน้าก่อนหน้านี้ คือ อย่างเต็มที่ parallelized ข้ามหลายมิติ แรกคือตารางกล่องมิติ , การคำนวณทั้งหมดอยู่ parallelized ข้ามมิตินี้ สอง คือ ชั้นตามแนวนอน ซึ่งตั้งไว้ที่ 101 ที่สามคือ wavenumber ซึ่งตั้งไว้ที่ 360 ในที่สุด , เขตข้อมูลคำสั่งเพิ่มสำหรับ PGI เร่งสั่งในสิ่งที่ข้อมูลความต้องการที่จะคัดลอก , คัดลอก , และในพื้นที่จัดสรรบน GPU . ทำอย่างชัดเจนเป็นสำคัญเพราะมิฉะนั้นรหัสจะใช้เวลามากทำไม่ความจำคัดลอกงาน หลังจากเสร็จสิ้นการความพยายามในการพัฒนาเหล่านี้ , PGI เร่งผลิต GPU เคอร์เนล คอมไพเลอร์สร้างข้อมูลเกี่ยวกับเมล็ดมันได้รวบรวม ซึ่งควรตรวจสอบให้แน่ใจว่า แต่ละส่วนของลูปทั้งหมด parallelized ข้ามมิติเป็นไปได้มาก เมื่อได้ผลลัพธ์ที่ต้องการจะได้รับสำหรับระยะเวลารวบรวมการทดสอบเปรียบเทียบ CPU รหัส GPU รหัส สามารถเริ่มต้น การไหลแผนภูมิแสดงขั้นตอนหลักในกระบวนการ porting จะแสดงในรูปที่ 2

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.