Application performance on multicor

Application performance on multicore processors is seldom constrained
by the speed of floating point or integer units. Much more
often, limitations are caused by the memory subsystem, particularly
shared resources such as last level caches or memory controllers.
Measuring, predicting and modeling memory performance
becomes a steeper challenge with each new processor generation
due to the growing complexity and core count. We tackle the
important aspect of measuring and understanding undocumented
memory performance numbers in order to create valuable insight
into microprocessor details. For this, we build upon a set of sophisticated
benchmarks that support latency and bandwidth measurements
to arbitrary locations in the memory subsystem. These
benchmarks are extended to support AVX instructions for bandwidth
measurements and to integrate the coherence states (O)wned
and (F)orward. We then use these benchmarks to perform an indepth
analysis of current ccNUMA multiprocessor systems with
Intel (Sandy Bridge-EP) and AMD (Bulldozer) processors. Using
our benchmarks we present fundamental memory performance data
and illustrate performance-relevant architectural properties of both
designs.

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

ค่อยจะจำกัดประสิทธิภาพของโปรแกรมประยุกต์บนตัวประมวลผล multicoreโดยความเร็วของน้ำจุดหรือจำนวนเต็มหน่วย อื่น ๆ อีกมากมายมักจะ ข้อจำกัดที่เกิดจากระบบย่อยของหน่วยความจำ โดยเฉพาะอย่างยิ่งทรัพยากรที่ใช้ร่วมกันเช่นตัวควบคุมหน่วยความจำแคชระดับสุดท้ายวัด คาดการณ์ และสร้างโมเดลประสิทธิภาพหน่วยความจำกลายเป็นความท้าทายสูงชันกับตัวประมวลผลรุ่นใหม่แต่ละเนื่องจากการเติบโตความซับซ้อนและหลักจำนวน เราแสวงการลักษณะสำคัญของวัดและไม่เข้าใจเกี่ยวกับเอกสารตัวเลขประสิทธิภาพหน่วยความจำเพื่อสร้างความเข้าใจที่มีคุณค่าลงรายละเอียดหน่วยประมวลผล สำหรับนี้ เราสร้างชุดของความซับซ้อนเกณฑ์มาตรฐานที่สนับสนุนแบนด์วิธและเวลาแฝงวัดสถานที่กำหนดให้ในระบบย่อยของหน่วยความจำ เหล่านี้เกณฑ์มาตรฐานจะขยายการสนับสนุนคำสั่ง AVX สำหรับแบนด์วิดท์การวัด และการรวมศักยภาพที่ระบุ wned (O)และ orward (F) เราใช้เกณฑ์มาตรฐานเหล่านี้เพื่อทำการฟแวร์แล้ววิเคราะห์ของระบบมัลติโปรเซสเซอร์ ccNUMA ปัจจุบันด้วยIntel (แซนดี้บริดจ์-EP) และโปรเซสเซอร์ AMD (รถปราบดิน) โดยใช้เกณฑ์มาตรฐานของเราแสดงข้อมูลประสิทธิภาพการทำงานหน่วยความจำพื้นฐานและแสดงคุณสมบัติสถาปัตยกรรมประสิทธิภาพที่เกี่ยวข้องของทั้งสองออกแบบ

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

ประสิทธิภาพการทำงานของแอพลิเคชันบนตัวประมวลผลแบบมัลติคอร์เป็นข้อ จำกัด ไม่ค่อย
โดยความเร็วของลอยจุดหรือหน่วยจำนวนเต็ม มากขึ้น
มักจะมีข้อ จำกัด ที่เกิดจากระบบย่อยหน่วยความจำโดยเฉพาะอย่างยิ่ง
ทรัพยากรร่วมกันเช่นแคชระดับสุดท้ายหรือตัวควบคุมหน่วยความจำ.
วัดทำนายและประสิทธิภาพการทำงานของหน่วยความจำแบบจำลอง
กลายเป็นความท้าทายสูงชันพร้อมกับโพรเซสเซอร์ใหม่แต่ละ
เนื่องจากความซับซ้อนที่เพิ่มขึ้นและจำนวนหลัก เราจะแก้ไขปัญหา
ที่สำคัญของการวัดและความเข้าใจที่ไม่มีเอกสาร
หมายเลขประสิทธิภาพหน่วยความจำเพื่อสร้างความเข้าใจที่มีคุณค่า
ในรายละเอียดไมโครโปรเซสเซอร์ สำหรับวันนี้เราสร้างชุดของที่ทันสมัย
มาตรฐานที่สนับสนุนความล่าช้าและการวัดแบนด์วิดธ์
ไปยังสถานที่โดยพลการในระบบย่อยของหน่วยความจำ เหล่านี้
มาตรฐานมีการขยายเพื่อรองรับคำสั่ง AVX แบนด์วิดธ์
วัดและเพื่อบูรณาการเชื่อมโยงรัฐ (O) WNED
และ (F) orward จากนั้นเราจะใช้มาตรฐานเหล่านี้จะดำเนินการแบบเจาะลึก
การวิเคราะห์ระบบมัลติ ccNUMA ปัจจุบันด้วย
Intel (Sandy Bridge-EP) และเอเอ็มดี (Bulldozer) โปรเซสเซอร์ โดยใช้
มาตรฐานของเราที่เรานำเสนอข้อมูลผลการดำเนินงานหน่วยความจำพื้นฐาน
และแสดงให้เห็นถึงคุณสมบัติของสถาปัตยกรรมประสิทธิภาพการทำงานที่เกี่ยวข้องของทั้งสอง
การออกแบบ

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

การประยุกต์ใช้งานบนโปรเซสเซอร์ multicore ไม่ใคร่บังคับ
โดยความเร็วของจุดลอยหรือจำนวนเต็มหน่วย มากขึ้น
มักจะข้อจำกัดที่เกิดจากหน่วยความจำระบบ โดยเฉพาะอย่างยิ่ง
ทรัพยากรร่วมกันเช่นแคชระดับสุดท้ายหรือตัวควบคุมหน่วยความจำ

แบบวัดและทำนายประสิทธิภาพหน่วยความจำกลายเป็นความท้าทายใหม่กับโปรเซสเซอร์รุ่น
ชันแต่ละเนื่องจากการเพิ่มขึ้นของจำนวนหลัก เราเล่นงาน
ข้อสำคัญวัดความเข้าใจและรับผิดชอบ
หน่วยความจำประสิทธิภาพตัวเลขเพื่อสร้าง
ข้อมูลเชิงลึกที่มีคุณค่าในรายละเอียดไมโครโปรเซสเซอร์ สำหรับเรื่องนี้ เราสร้างชุดของมาตรฐานที่สนับสนุนศักยภาพและแบนด์วิดธ์ที่ซับซ้อน

เพื่อวัดสถานที่โดยพลการในหน่วยความจำนี้ เหล่านี้
บริษัทมีการขยายเพื่อรองรับคำสั่ง AVX สำหรับวัดแบนด์วิดธ์
และบูรณาการการสหรัฐอเมริกา ( O ) wned
( F ) orward . เราใช้มาตรฐานเหล่านี้จะทำการเจาะลึก
การวิเคราะห์ปัจจุบัน ccnuma มัลติระบบ
Intel ( ทราย EP สะพาน ) และ AMD ( Bulldozer ) ) การใช้มาตรฐานของเรา เรานำเสนองาน

จำข้อมูลพื้นฐานและแสดงให้เห็นถึงประสิทธิภาพที่เกี่ยวข้องงานสถาปัตยกรรมคุณสมบัติทั้ง
ออกแบบ

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.