Dynamic Cache Contention Detection

Dynamic Cache Contention Detection in Multi-threaded Applications

In this paper, we present a novel approach that efficiently ana- lyzes interactions between threads to determine thread correlation and detect true and false sharing. It is based on the following key insight: although the slowdown caused by cache contention de- pends on factors including the thread-to-core binding and param- eters of the memory hierarchy, the amount of data sharing is pri- marily a function of the cache line size and application behavior. Using memory shadowing and dynamic instrumentation, we im- plemented a tool that obtains detailed sharing information between threads without simulating the full complexity of the memory hi- erarchy. The runtime overhead of our approach — a 5× slowdown on average relative to native execution — is significantly less than that of detailed cache simulation. The information collected allows programmers to identify the degree of cache contention in an appli- cation, the correlation among its threads, and the sources of signif- icant false sharing. Using our approach, we were able to improve the performance of some applications by up to a factor of 12×. For other contention-intensive applications, we were able to shed light on the obstacles that prevent their performance from scaling to many cores.

Dynamic Cache Contention Detection in Multi-threaded Applications

In this paper, we present a novel approach that efficiently ana- lyzes interactions between threads to determine thread correlation and detect true and false sharing. It is based on the following key insight: although the slowdown caused by cache contention de- pends on factors including the thread-to-core binding and param- eters of the memory hierarchy, the amount of data sharing is pri- marily a function of the cache line size and application behavior. Using memory shadowing and dynamic instrumentation, we im- plemented a tool that obtains detailed sharing information between threads without simulating the full complexity of the memory hi- erarchy. The runtime overhead of our approach — a 5× slowdown on average relative to native execution — is significantly less than that of detailed cache simulation. The information collected allows programmers to identify the degree of cache contention in an appli- cation, the correlation among its threads, and the sources of signif- icant false sharing. Using our approach, we were able to improve the performance of some applications by up to a factor of 12×. For other contention-intensive applications, we were able to shed light on the obstacles that prevent their performance from scaling to many cores.

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

แคแบบไดนามิกตรวจหาข้อขัดแย้งในการใช้งานแบบมัลติเธรดในกระดาษนี้ เรานำเสนอวิธีการใหม่ที่มีประสิทธิภาพ ana lyzes โต้ตอบระหว่างเธรดเพื่อกำหนดความสัมพันธ์ของเธรด และตรวจหา true และ false ร่วมกัน ขึ้นอยู่กับข้อมูลเชิงลึกที่สำคัญต่อไปนี้: แม้ว่าการชะลอตัวที่เกิดจากแคชิงยไดปัจจัยรวมทั้งผูกด้ายการหลักและ param-นหาครูลำดับชั้นหน่วยความจำ จำนวนของการแบ่งปันข้อมูลเป็น pri-marily การทำงานของแคบรรทัดขนาด และการใช้งานลักษณะการทำงาน ใช้หน่วยความจำทำแชโดว์และเครื่องมือวัดแบบไดนามิก เรา im-plemented เครื่องมือที่ได้รับข้อมูลรายละเอียดที่ใช้ร่วมกันระหว่างเธรดโดยจำลองความซับซ้อนทั้งหมดของของหน่วยความจำสูง-erarchy ค่าใช้จ่ายในรันไทม์ของเรา — ชะลอ 5 ×ตัว โดยเฉลี่ยเมื่อเทียบกับท้องถิ่นดำเนินการ — มีมากน้อยกว่าของจำลองรายละเอียดแค ข้อมูลที่รวบรวมช่วยให้โปรแกรมเมอร์สามารถระบุระดับของแคข้อขัดแย้งในการพลิรก ความสัมพันธ์ระหว่างเส้น และแหล่งมาของ signif icant เท็จร่วมกัน ใช้วิธีการของเรา เราก็สามารถที่จะเพิ่มประสิทธิภาพของโปรแกรมประยุกต์บางโปรแกรมโดยขึ้นอยู่กับปัจจัยของ 12 × สำหรับโปรแกรมประยุกต์อื่น ๆ ของข้อขัดแย้งมาก เราก็สามารถที่จะหลั่งน้ำตาแสงในอุปสรรคที่ขัดขวางประสิทธิภาพของพวกเขาจากไปกี่แกน

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

แบบไดนามิกแคชการตรวจสอบความขัดแย้งในการใช้งานแบบมัลติเธรดในบทความนี้เราจะนำเสนอวิธีการใหม่ที่มีประสิทธิภาพ ana- lyzes ปฏิสัมพันธ์ระหว่างหัวข้อในการกำหนดความสัมพันธ์ด้ายและตรวจสอบการใช้งานร่วมกันจริงและเท็จ มันขึ้นอยู่กับความเข้าใจที่สำคัญดังต่อไปนี้: แม้ว่าการชะลอตัวที่เกิดจากการต่อสู้แคช de- pends กับปัจจัยรวมทั้งแกนด้ายต่อการมีผลผูกพันและพารารามิเตอร์ของลำดับชั้นหน่วยความจำจำนวนเงินของการใช้ข้อมูลร่วมกันเป็นขั้นต้น Marily เป็นหน้าที่ของ ขนาดเส้นแคชและพฤติกรรมการใช้ การใช้หน่วยความจำแชโดว์และเครื่องมือแบบไดนามิกเราอิ่ม plemented เครื่องมือที่ได้รับข้อมูลที่ใช้ร่วมกันระหว่างหัวข้อรายละเอียดโดยไม่ต้องเลียนแบบความซับซ้อนเต็มรูปแบบของหน่วยความจำ Hi- erarchy ค่าใช้จ่ายรันไทม์ของวิธีการของเรา - 5 ×ชะลอตัวในญาติเฉลี่ยในการดำเนินพื้นเมือง - อย่างมีนัยสำคัญน้อยกว่าที่จำลองแคชรายละเอียด ข้อมูลที่เก็บรวบรวมช่วยให้โปรแกรมเมอร์เพื่อระบุระดับของการต่อสู้แคชในไอออนปพลิเคชั่ความสัมพันธ์ในหมู่หัวข้อและแหล่งที่มาของการแบ่งปัน signif- เท็จ icant โดยใช้วิธีการของเราเราก็สามารถที่จะปรับปรุงประสิทธิภาพของการใช้งานบางได้ถึงปัจจัยจาก 12 × สำหรับการใช้งานการต่อสู้มากอื่น ๆ เราก็สามารถที่จะหลั่งน้ำตาแสงในอุปสรรคที่ป้องกันไม่ให้ประสิทธิภาพของพวกเขาจากการปรับแกนจำนวนมาก

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

แบบไดนามิกโปรแกรมหลายเธรดการตรวจสอบแคชในในกระดาษนี้เรานำเสนอแนวทางใหม่ที่มีประสิทธิภาพ Ana - lyzes ปฏิสัมพันธ์ระหว่างหัวข้อเพื่อกำหนดหัวข้อความสัมพันธ์และตรวจสอบจริง และร่วมกันปลอม มันขึ้นอยู่กับข้อมูลเชิงลึกที่สําคัญดังต่อไปนี้ : แม้ว่าการชะลอตัวที่เกิดจากแคชการ de - เกียรติในปัจจัย ได้แก่ หัวข้อหลัก และพระราม - eters ของหน่วยความจำระบบ ปริมาณของข้อมูลที่เป็นฟังก์ชันของ มาริลี่พรี - แคชขนาดเส้น และพฤติกรรมการ การใช้เครื่องมือแบบไดนามิกและความเงา เราอิ่ม - plemented เครื่องมือที่ได้รับรายละเอียดการแชร์ข้อมูลระหว่างหัวข้อโดยจำลองเต็มความซับซ้อนของหน่วยความจำ Hi - erarchy . รันไทม์ในแบบของเรา - 5 ×อัตราเฉลี่ยเมื่อเทียบกับการประหาร - พื้นเมืองเป็นอย่างมีนัยสำคัญน้อยกว่าที่ของการจำลองแคชรายละเอียด ข้อมูลที่เก็บรวบรวมจะช่วยให้โปรแกรมเมอร์เพื่อระบุระดับของการต่อสู้ในการใช้แคช - ไอออนบวก ความสัมพันธ์ของกระทู้ และแหล่ง signif - ไอ้แค้นเท็จแบ่งปัน โดยใช้แนวทางของเรา เราสามารถที่จะปรับปรุงประสิทธิภาพของโปรแกรมประยุกต์บางโปรแกรมได้ถึงปัจจัย 12 × . เพื่ออื่น ๆการต่อสู้ที่เข้มข้น การใช้งาน เราสามารถหลั่งไฟบนอุปสรรคที่ขัดขวางการปฏิบัติงานของตนเอง จากแบบแกนหลาย

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.