ganization of your data structures

ganization of your data structures to make maximum use of the SIMD instructions.
The new instructions also provide techniques for turning control dependencies into data dependencies. For example, there are instructions that set a variable to a mask of zeros or ones based on the comparison of two values. Boolean operations can then be used to set a pointer to one of two values based on the mask. Viewpoint clipping can be implemented by this technique without using a branch instruction. Because unpredictable branches are relatively expensive on modern processors, removing them can increase performance.
As mentioned earlier, memory latency is becoming more and more of a bottleneck. We have tried to carefully organize our data structures to minimize the amount of memory that must be accessed by any single computation stage and to ensure that the memory is accessed in a predictable linear manner. Adding prefetch instructions can also help to hide memory latency, though this is somewhat less important on Pentium 4 processors because the automatic hardware prefetch mechanism often works quite well for linear access patterns.

4. Results
Timings for the render cache to generate one frame at 512x512 on a 1.7GHz Pentium 4 machine are shown in Table 1. Despite that fact that we have added additional computation stages and are using images with four times as many pixels, the frame time is slightly faster than original results reported in10. We estimate that roughly half the speedup comes from using a faster processor and half from the SIMD and other optimizations that we have applied.

ganization of your data structures to make maximum use of the SIMD instructions.
  The new instructions also provide techniques for turning control dependencies into data dependencies. For example, there are instructions that set a variable to a mask of zeros or ones based on the comparison of two values. Boolean operations can then be used to set a pointer to one of two values based on the mask. Viewpoint clipping can be implemented by this technique without using a branch instruction. Because unpredictable branches are relatively expensive on modern processors, removing them can increase performance. 
 As mentioned earlier, memory latency is becoming more and more of a bottleneck. We have tried to carefully organize our data structures to minimize the amount of memory that must be accessed by any single computation stage and to ensure that the memory is accessed in a predictable linear manner. Adding prefetch instructions can also help to hide memory latency, though this is somewhat less important on Pentium 4 processors because the automatic hardware prefetch mechanism often works quite well for linear access patterns.

4. Results
Timings for the render cache to generate one frame at 512x512 on a 1.7GHz Pentium 4 machine are shown in Table 1. Despite that fact that we have added additional computation stages and are using images with four times as many pixels, the frame time is slightly faster than original results reported in10. We estimate that roughly half the speedup comes from using a faster processor and half from the SIMD and other optimizations that we have applied.

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

ganization โครงสร้างข้อมูลของคุณให้สูงสุดใช้คำสั่ง SIMD คำแนะนำใหม่ยังมีเทคนิคสำหรับการปรับควบคุมการอ้างอิงเป็นข้อมูลอ้างอิง ตัวอย่าง มีคำแนะนำที่กำหนดตัวแปรรูปแบบของศูนย์หรือคนตามการเปรียบเทียบค่าสองค่า แล้วใช้การดำเนินงานแบบบูลีนการตั้งค่าตัวชี้เป็นหนึ่งในสองค่าขึ้นอยู่กับรูปแบบการ คลิปหน้าจุดชมวิวสามารถใช้ โดยเทคนิคนี้โดยคำสั่งที่สาขา เนื่องจากสาขาที่ไม่แน่นอนค่อนข้างแพงในโปรเซสเซอร์ที่ทันสมัย ลบสามารถเพิ่มประสิทธิภาพ เป็นที่กล่าวถึงก่อนหน้านี้ หน่วยความจำแฝงจะกลายเป็น เพิ่มเติมและเพิ่มเติมของคอขวด เราได้พยายามจัดระเบียบโครงสร้างของข้อมูล เพื่อลดจำนวนหน่วยความจำที่ต้องเข้าถึงขั้นตอนการคำนวณเดียว และ เพื่อให้แน่ใจว่า หน่วยความจำที่เข้าถึงในลักษณะเชิงเส้นได้อย่างรอบคอบ เพิ่มคำแนะนำการดึงข้อมูลล่วงหน้าสามารถช่วยซ่อนแฝงหน่วยความจำ แม้นี้ก็ค่อนข้างน้อยบนตัวประมวลผล Pentium 4 เพราะ prefetch กลไกอัตโนมัติฮาร์ดแวร์มักจะทำงานค่อนข้างดีสำหรับรูปแบบเข้าเส้น4. ผลลัพธ์กำหนดเวลาสำหรับการแค render เพื่อสร้างกรอบหนึ่งที่ 512 x 512 บนเครื่อง Pentium 4 1.7GHz แสดงในตารางที่ 1 แม้ว่าความจริงที่เราได้เพิ่มขั้นตอนการคำนวณเพิ่มเติม และใช้ภาพพิกเซลสี่ครั้งเป็นจำนวนมาก กรอบเวลาได้เร็วขึ้นเล็กน้อยกว่า in10 รายงานผลเดิม เราประเมินว่า ประมาณครึ่ง speedup มาใช้ประมวลผลได้เร็วขึ้นอีกครึ่งหนึ่งจาก SIMD และเพิ่มประสิทธิภาพอื่น ๆ ที่เราใช้

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

คจของโครงสร้างข้อมูลของคุณที่จะทำให้การใช้งานสูงสุดของคำแนะนำ SIMD.
คำสั่งใหม่นอกจากนี้ยังมีเทคนิคในการเปลี่ยนการอ้างอิงการควบคุมลงไปในการอ้างอิงข้อมูล ตัวอย่างเช่นมีคำสั่งที่กำหนดตัวแปรหน้ากากของศูนย์หรือคนที่อยู่บนพื้นฐานของการเปรียบเทียบสองค่า การดำเนินการบูลีนนั้นจะสามารถใช้ในการตั้งตัวชี้ไปยังหนึ่งในสองค่าขึ้นอยู่กับหน้ากาก ตัดจุดชมวิวสามารถดำเนินการโดยเทคนิคนี้โดยไม่ต้องใช้การเรียนการสอนสาขา เพราะสาขาคาดเดาไม่ได้จะค่อนข้างแพงในโปรเซสเซอร์ที่ทันสมัยลบพวกเขาสามารถเพิ่มประสิทธิภาพการทำงาน.
ดังกล่าวก่อนหน้าแฝงหน่วยความจำมากขึ้นและมากขึ้นของคอขวด เราได้พยายามที่จะระมัดระวังในการจัดระเบียบโครงสร้างข้อมูลของเราที่จะลดจำนวนหน่วยความจำที่จะต้องเข้าถึงได้โดยขั้นตอนการคำนวณใด ๆ เดียวและเพื่อให้แน่ใจว่าหน่วยความจำที่มีการเข้าถึงในลักษณะเชิงเส้นที่คาดการณ์ เพิ่มคำแนะนำ prefetch ยังสามารถช่วยในการซ่อนแฝงหน่วยความจำแม้ว่าจะค่อนข้างมีความสำคัญน้อยลงใน Pentium 4 โปรเซสเซอร์เพราะกลไก prefetch ฮาร์ดแวร์อัตโนมัติมักจะทำงานค่อนข้างดีสำหรับรูปแบบการเข้าถึงเชิงเส้น. 4 ผลการกำหนดเวลาในการทำให้แคชเพื่อสร้างทีละเฟรม 512x512 บน 1.7GHz Pentium 4 เครื่องจะแสดงในตารางที่ 1 แม้จะมีความจริงที่ว่าเราได้เพิ่มขั้นตอนการคำนวณเพิ่มเติมและมีการใช้ภาพที่มีสี่เท่าพิกเซลหลายครั้งกรอบ เล็กน้อยเร็วกว่าเดิมรายงานผลการ IN10 เราคาดว่าประมาณครึ่งหนึ่ง speedup มาจากการใช้หน่วยประมวลผลได้เร็วขึ้นและครึ่งหนึ่งจาก SIMD และการเพิ่มประสิทธิภาพอื่น ๆ ที่เราได้นำมาใช้

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

ganization โครงสร้างข้อมูลของคุณเพื่อให้ใช้ประโยชน์สูงสุดของ simd แนะนํา .
คำแนะนำใหม่ยังมีเทคนิคสำหรับการพึ่งพาการควบคุมในการอ้างอิงข้อมูล ตัวอย่างเช่น มีคำแนะนำที่กำหนดตัวแปรในรูปแบบของศูนย์ หรือคนที่ใช้ในการเปรียบเทียบของทั้งสองค่า ตรรกะการดำเนินงานก็สามารถใช้ชุดตัวชี้ไปยังหนึ่งในสองยึดค่าหน้ากากมุมมองการใช้เทคนิคนี้ได้โดยไม่ต้องใช้ สาขาการสอน เพราะไม่อาจคาดเดาจะค่อนข้างแพงในสาขาการประมวลผลที่ทันสมัย ลบ สามารถเพิ่มประสิทธิภาพ
ตามที่กล่าวถึงก่อนหน้านี้ เวลาจำเป็นเพิ่มเติม และเพิ่มเติมของคอขวด .เราได้พยายามที่จะระมัดระวังจัดระเบียบโครงสร้างข้อมูลเพื่อลดปริมาณของหน่วยความจำที่ต้องเข้าถึงได้โดยขั้นตอนการคำนวณใด ๆเดียว และเพื่อให้แน่ใจว่าหน่วยความจำที่เข้าถึงได้ในแบบฉบับเชิงลักษณะ เพิ่มคำสั่ง prefetch สามารถช่วยซ่อนแฝงความจำแม้ว่านี้จะค่อนข้างน้อยกว่าที่สำคัญบนโปรเซสเซอร์ Pentium 4 เพราะอัตโนมัติฮาร์ดแวร์ prefetch กลไกมักจะทำงานค่อนข้างดีสำหรับรูปแบบการเข้าถึงโดยตรง

4 . เวลาสำหรับแสดงผล
แคชเพื่อสร้างหนึ่งเฟรมที่ 512x512 บน 1.7ghz Pentium 4 เครื่องจะแสดงในตารางที่ 1แม้จะมีความจริงที่ว่าเราได้เพิ่มขั้นตอนการคำนวณเพิ่มเติมและมีการใช้ภาพเป็น 4 เท่าพิกเซล กรอบเวลา ค่อนข้างเร็วกว่าเดิม รายงานผล 10 . เราประเมินว่า ประมาณครึ่งหนึ่งของการเร่งความเร็วมาจากใช้เร็วขึ้นโปรเซสเซอร์และครึ่งหนึ่งจาก simd เพิ่มประสิทธิภาพอื่น ๆและที่เราใช้ .

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.