From a high-level perspective, two

From a high-level perspective, two main approaches can be
used to exploit parallelism in multicore platforms. The first
approach parallelizes the decoder itself through decomposition of
the decoding algorithms into multiple threads that run in parallel.
Second, multiple codewords may be decoded in parallel. The first
approach decreases the latency per codeword but introduces more
synchronization overhead across different threads. By contrast,
the second approach uses less synchronization objects and therefore
increases the parallelization gain. However, it may introduce a
higher latency per codeword compared to the first approach.
For very high throughput applications, LDPC codes are known
to compare favorably against turbo codes because LDPC decoding
allows for a higher degree of parallelism [25], [26]. Hence, LDPC
codes are suitable for the first approach of decoder parallelization.
However, software-based parallel LDPC decoders barely achieve
throughputs of a few tens of Mbit∕s, as reported in [27] for graphical
processing units (GPUs), or in [28] for the signal processing
on-demand architecture (SODA). In both cases, the main reason is
the need for synchronization across different threads to access
shared objects that results in scalability issues [27].
By contrast, parallelizing multiple codewords eliminates the
need for synchronizing objects. This results in better scalability
properties and the throughput of the multicodeword decoder is
known to increase almost linearly with the number of cores [29].
Furthermore, it allows for different codes, algorithms, and configurations
running in parallel. Multicodeword LDPC decoders
have been reported to achieve throughputs up to 80 Mbit/s on
the IBM CELL Broadband Engine [27], [30], with 24–96 codewords
decoded in parallel. Recently, central processing unit
(CPU) and GPU implementations of multicodeword turbo decoders
have also been reported in [31] with a peak throughput from
55 Mbit/s to 122 Mbit/s, as the number of decoding iterations
decreases from eight to four.
Figure 4 shows experimental results for spectral efficiency and
required computational complexity of an 3GPP LTE UL decoder.
To obtain these results, the turbo-decoder has been implemented
on a default VMWare ESXi server with Ubuntu Linux host operating
system, GNU C++ compiler, and codeword multithreading to
account for the virtualization overhead. We measured the
required CPU time to decode one codeword and determined the
average CPU time within the 90% confidence interval.
Figure 4(a) shows the achievable spectral efficiency for a given
signal-to-noise ratio (SNR) (additive white Gaussian noise, no fading).
We illustrate the results for two cases: maximum throughput
(high number of iterations possible) and low complexity
(number of iterations limited to two). Reducing the complexity of
the decoding process results in a performance penalty of 1–2 dB.
In Figure 4(b), we show the required computational resources for
a 10-MHz 3GPP LTE system. The required complexity strongly
depends upon the SNR. First, it increases linearly with the number
of information bits, which implies a logarithmic increase of
complexity in SNR. Second, the complexity increases with the
number of iterations that are necessary to decode a codeword. As
shown in [32], the complexity increases superlinearly with
decreasing SNR (in decibels) for a fixed MCS. In Figure 4(b),

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

จากมุมมองระดับสูง วิธีสองหลักได้การกดขี่ขูดรีดในระบบ multicore parallelism ครั้งแรกวิธี parallelizes ที่ถอดรหัสตัวเองผ่านแยกส่วนประกอบของถอดรหัสการอัลกอริทึมเป็นหลายเธรดที่รันพร้อมกันสอง codewords หลายอาจถอดรหัสพร้อมกันได้ ครั้งแรกวิธีลดเวลาแฝงต่อ codeword แต่แนะนำเพิ่มเติมซิงโครไนส์ค่าใช้จ่ายในหัวข้อต่าง ๆ โดยคมชัดวิธีที่สองใช้วัตถุน้อยตรงดังนั้นเพิ่มกำไร parallelization อย่างไรก็ตาม อาจแนะนำการเวลาแฝงที่สูงต่อ codeword ที่เปรียบเทียบกับวิธีแรกสำหรับการใช้งานอัตราความเร็วสูงมาก รหัส LDPC รู้จักกันการเปรียบเทียบพ้องต้องกับรหัสเทอร์โบเนื่องจากถอดรหัส LDPCได้ในระดับที่สูงของ parallelism [25], [26] ดังนั้น LDPCรหัสเหมาะสำหรับวิธีแรกของ parallelization ถอดรหัสอย่างไรก็ตาม ซอฟต์แวร์ถอดรหัส LDPC ขนานแทบบรรลุthroughputs กี่สิบ Mbit∕s ตามรายงานใน [27] สำหรับกราฟิกประมวลผลหน่วย (GPUs), หรือ [28] สำหรับการประมวลผลสัญญาณสถาปัตยกรรมตามความต้องการ (โซดา) ในทั้งสองกรณี เหตุผลหลักคือต้องการซิงโครไนส์ในหัวข้อที่แตกต่างกันถึงวัตถุที่ใช้ร่วมกันที่มีผลขนาดปัญหา [27]โดยคมชัด parallelizing codewords หลายลดการต้องการซิงโครไนส์วัตถุ ซึ่งผลขยับดีกว่าคุณสมบัติและอัตราความเร็วของตัวถอดรหัส multicodewordเป็นที่รู้จักเพื่อเพิ่มเกือบเชิงเส้น มีจำนวนแกน [29]นอกจากนี้ จะช่วยให้การแตกต่างกันรหัส อัลกอริทึม และตั้งค่าคอนฟิกทำงานควบคู่กัน ถอดรหัส Multicodeword LDPCมีการรายงานให้ throughputs ถึง 80 Mbit/s ในเซลล์ IBM บรอดแบนด์เครื่องยนต์ [27], [30], กับ codewords 24-96ถอดรหัสควบคู่กัน ล่าสุด หน่วยประมวลผลกลาง(CPU) และการใช้งาน GPU ของตัวถอดรหัสเทอร์โบ multicodewordนอกจากนี้รายงานใน [31] กับอัตราความเร็วสูงสุดจาก55 Mbit/s ถึง 122 Mbit/s เป็นจำนวนการเกิดซ้ำที่ถอดรหัสลดลงจากแปดสี่รูปที่ 4 แสดงผลลัพธ์การทดลองหาประสิทธิภาพสเปกตรัม และต้องคำนวณซับซ้อนเป็น 3GPP LTE UL ตัวถอดรหัสเพื่อให้ได้ผลลัพธ์เหล่านี้ การใช้ถอดรหัสเทอร์โบบนเซิร์ฟเวอร์ VMWare ESXi เริ่มต้นกับ Ubuntu Linux โฮสต์ที่ทำงานระบบ GNU c ++คอมไพเลอร์ และมัลติเธรดการ codewordบัญชีสำหรับค่าใช้จ่ายในการจำลองเสมือน เราวัดเวลา CPU ถอดรหัส codeword หนึ่งที่จำเป็น และกำหนดเวลา CPU เฉลี่ยภายในช่วงความเชื่อมั่น 90%4(a) รูปแสดงสเปกตรัมประสิทธิภาพทำได้ในการกำหนดอัตราส่วนสัญญาณเสียงรบกวน (SNR) (additive ขาว Gaussian เสียง ไม่เลือนหายไป)เราแสดงผลสำหรับกรณีที่ 2: อัตราความเร็วสูงสุด(สูงจำนวนการเกิดซ้ำได้) และต่ำสุดซับซ้อน(หมายเลขซ้ำสองจำกัด) ลดความซับซ้อนของกระบวนการถอดรหัสผลการปรับประสิทธิภาพของ 1-2 dBในรูป 4(b) แสดงทรัพยากรคอมพิวเตอร์จำเป็นสำหรับระบบ LTE 3GPP 10 MHz ที่ต้องการความซับซ้อนอย่างยิ่งขึ้น SNR ครั้งแรก มันเพิ่มขึ้นเชิงเส้นกับหมายเลขของบิตข้อมูล ซึ่งหมายถึงการเพิ่มลอการิทึมความซับซ้อนใน SNR ที่สอง ความซับซ้อนเพิ่มขึ้นกับการจำนวนการเกิดซ้ำที่จำเป็นต้องถอดรหัสเป็น codeword เป็น[32] แสดง ความซับซ้อนเพิ่มขึ้น superlinearly กับลด SNR (ใน decibels) สำหรับเอ็มซีถาวร ในรูป 4(b)

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

จากมุมมองของระดับสูงสองวิธีหลักที่สามารถใช้ในการใช้ประโยชน์จากความเท่าเทียมในแพลตฟอร์มแบบมัลติคอร์ ครั้งแรกที่วิธีการ parallelizes ถอดรหัสตัวเองผ่านการสลายตัวของขั้นตอนวิธีการถอดรหัสออกเป็นหลายหัวข้อที่ทำงานในแบบคู่ขนาน. ประการที่สอง codewords หลายอาจจะถอดรหัสในแบบคู่ขนาน ครั้งแรกที่วิธีการแฝงลดลงต่อ codeword แต่แนะนำเพิ่มเติมค่าใช้จ่ายในการประสานทั่วหัวข้อที่แตกต่าง ในทางตรงกันข้ามวิธีที่สองใช้วัตถุประสานจึงน้อยลงและการเพิ่มขึ้นของกำไรparallelization แต่ก็อาจจะแนะนำแฝงต่อ codeword ที่สูงขึ้นเมื่อเทียบกับวิธีแรก. สำหรับการใช้งานผ่านสูงมาก, รหัส LDPC เป็นที่รู้จักกันเพื่อเปรียบเทียบในเกณฑ์ดีกับรหัสเทอร์โบเพราะถอดรหัสLDPC ช่วยให้ระดับสูงของความเท่าเทียม [25] [26] ดังนั้น LDPC รหัสที่มีความเหมาะสมสำหรับวิธีแรกของการถอดรหัส parallelization. แต่ซอฟต์แวร์ที่ใช้ถอดรหัส LDPC ขนานแทบจะไม่บรรลุthroughputs ของไม่กี่สิบ Mbit / s รายงานใน [27] สำหรับกราฟิกประมวลผลหน่วย(GPUs) หรือใน [28] สำหรับการประมวลผลสัญญาณสถาปัตยกรรมตามความต้องการ(โซดา) ในทั้งสองกรณีเหตุผลหลักที่เป็นความจำเป็นในการทำข้อมูลให้ตรงกันทั่วหัวข้อที่แตกต่างในการเข้าถึงวัตถุที่ใช้ร่วมกันที่ส่งผลให้ปัญหาscalability [27]. ในทางตรงกันข้าม parallelizing codewords หลายช่วยลดความจำเป็นในการทำข้อมูลให้ตรงกันวัตถุ ซึ่งจะส่งผลที่ดีกว่าในการปรับขยายคุณสมบัติและผ่านการถอดรหัส multicodeword เป็นที่รู้จักกันที่จะเพิ่มขึ้นเกือบเป็นเส้นตรงกับจำนวนแกน[29]. นอกจากนี้ยังช่วยให้รหัสที่แตกต่างกันขั้นตอนวิธีการและการกำหนดค่าการทำงานในแบบคู่ขนาน Multicodeword ถอดรหัส LDPC ได้รับการรายงานเพื่อให้บรรลุ throughputs ถึง 80 Mbit / s ในไอบีเอ็มCELL บรอดแบนด์เครื่องยนต์ [27], [30] กับ 24-96 codewords ถอดรหัสในแบบคู่ขนาน เมื่อเร็ว ๆ นี้หน่วยประมวลผลกลาง(CPU) และการใช้งานของ GPU multicodeword ถอดรหัสเทอร์โบยังได้รับรายงานใน[31] ด้วยการผ่านจุดสูงสุดจาก55 Mbit / s เพื่อ 122 Mbit / s จำนวนซ้ำถอดรหัสลดลง8-4 รูปที่ 4 แสดงผลการทดลองอย่างมีประสิทธิภาพสเปกตรัมและความซับซ้อนของคอมพิวเตอร์ที่ต้องการของตัวถอดรหัสLTE 3GPP UL. ที่จะได้รับผลเหล่านี้เทอร์โบถอดรหัสได้รับการดำเนินการบนเซิร์ฟเวอร์เริ่มต้น VMWare ESXi กับ Linux Ubuntu ปฏิบัติการโฮสต์ระบบคอมไพเลอร์GNU C ++ และ codeword multithreading การบัญชีสำหรับค่าใช้จ่ายในการทำงานแบบเสมือน เราวัดเวลา CPU ที่จำเป็นในการถอดรหัสหนึ่ง codeword และกำหนดเวลาCPU เฉลี่ยในช่วงความเชื่อมั่น 90%. รูปที่ 4 (ก) แสดงให้เห็นถึงประสิทธิภาพสเปกตรัมทำได้สำหรับให้สัญญาณต่อเสียงรบกวนอัตราส่วน(SNR) (สารเติมแต่งเสียงเสียนสีขาว . ไม่ซีดจาง) เราแสดงให้เห็นถึงผลสำหรับกรณีที่สอง: ความเร็วสูงสุด(จำนวนมากของการทำซ้ำเป็นไปได้) และความซับซ้อนต่ำ(จำนวน จำกัด ซ้ำสอง) ลดความซับซ้อนของผลกระบวนการถอดรหัสในประสิทธิภาพการทำงานของโทษ 1-2 เดซิเบลได้. ในรูปที่ 4 (ข) เราจะแสดงที่ต้องใช้ทรัพยากรคอมพิวเตอร์สำหรับ10 MHz ระบบ 3GPP LTE ความซับซ้อนที่จำเป็นอย่างยิ่งขึ้นอยู่กับ SNR ก่อนจะเพิ่มขึ้นเป็นเส้นตรงกับจำนวนของบิตข้อมูลซึ่งหมายถึงการเพิ่มขึ้นของลอการิทึมของความซับซ้อนในSNR ประการที่สองความซับซ้อนที่เพิ่มขึ้นกับจำนวนของการทำซ้ำที่มีความจำเป็นในการถอดรหัส codeword ในฐานะที่แสดงใน [32] ความซับซ้อนเพิ่มขึ้น superlinearly กับการลดSNR (เดซิเบล) สำหรับ MCS คงที่ ในรูปที่ 4 (ข)

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

จากมุมมองพื้นฐาน สองแนวทางหลักที่สามารถใช้เพื่อใช้ประโยชน์จากความ
สถาปัตยกรรมมัลติคอร์ . วิธีการแรก
parallelizes ถอดรหัสตัวเองผ่านการสลายตัวของ
ถอดรหัสขั้นตอนวิธีในหลายๆ กระทู้ ที่วิ่งขนาน .
2 หลาย codewords อาจจะถอดรหัสในแบบขนาน วิธีการแรก
ลดศักยภาพต่อ codeword แต่แนะนำเพิ่มเติม
ประสานเหนือศีรษะในหัวข้อที่แตกต่างกัน โดยคมชัด
วิธีที่สองใช้น้อยกว่าวัตถุประสานจึง
เพิ่ม parallelization ไปเข้า อย่างไรก็ตาม อาจแนะนำ
สูงกว่าศักยภาพต่อ codeword เปรียบเทียบกับวิธีแรก
สำหรับการใช้งาน throughput สูงมาก , รหัส LDPC รู้จัก
เปรียบเทียบพ้องต้องกันกับรหัสเทอร์โบเพราะ LDPC ถอดรหัส
ช่วยให้ระดับที่สูงขึ้นของความขนาน [ 25 ] [ 26 ] ดังนั้น รหัส LDPC
เหมาะสำหรับวิธีการแรกของตัวถอดรหัส parallelization ไป .
แต่ใช้ซอฟต์แวร์ถอดรหัส LDPC ขนานแทบบรรลุ
throughputs ไม่กี่ 10 Mbit The C button of the calculator , ตามที่รายงานใน [ 27 ] สำหรับหน่วยประมวลผลกราฟิก ( GPUs )
, [ 28 ] หรือในการประมวลผลสัญญาณ (
- สถาปัตยกรรม โซดา ) ในทั้งสองกรณี เหตุผลหลักคือ
ต้องประสานผ่านหัวข้อที่แตกต่างกันในการเข้าถึงวัตถุที่ผลลัพธ์ในการทำงาน
แบ่งปันปัญหา [ 27 ] .
โดยคมชัด , parallelizing หลาย codewords ขจัด
ต้องตรงกันวัตถุ ผลลัพธ์ดี scalability
คุณสมบัติและอัตราความเร็วของ multicodeword ถอดรหัส
รู้จักเพิ่มเกือบเป็นเส้นตรง ด้วยหมายเลขของแกน [ 29 ] .
นอกจากนี้มันช่วยให้รหัสที่แตกต่างกัน อัลกอริทึม และการกำหนดค่า
วิ่งขนาน multicodeword LDPC ถอดรหัส
ได้รับการรายงานเพื่อให้บรรลุ throughputs ถึง 80 Mbit / s
IBM มือถือบรอดแบนด์เครื่องยนต์ [ 27 ] [ 30 ] , 24 – 96 codewords
ถอดรหัสในแบบขนาน เมื่อเร็วๆ นี้ หน่วยประมวลผลกลาง ( CPU ) และ GPU

ใช้ multicodeword ถอดรหัสเทอร์โบนอกจากนี้ยังมีรายงานใน [ 31 ] กับ throughput สูงสุดจาก
55 เมกะบิต / วินาทีกับ 122 Mbit / s เป็นจำนวน 1 รอบ
ลดลงจาก 8 เหลือ 4 .
รูปที่ 4 แสดงผลการทดลองประสิทธิภาพสเปกตรัมและความซับซ้อนของ 3GPP LTE
เป็น UL ถอดรหัสคอมพิวเตอร์ .
ให้ได้ผลลัพธ์เหล่านี้ วงจรถอดรหัสเทอร์โบที่มีการใช้งาน
ในการเริ่มต้นกับ Ubuntu Linux โฮสต์เซิร์ฟเวอร์ VMware esxi ปฏิบัติการ
ระบบ GNU C คอมไพเลอร์ และ codeword ตอนหลัง

สำหรับ virtualization บัญชีค่าใช้จ่าย เราวัด
ต้องการ CPU เวลาถอดรหัสหนึ่ง codeword และมุ่งมั่น
เวลา CPU เฉลี่ยภายใน 90% ความเชื่อมั่น .
รูปที่ 4 ( ก ) แสดงได้สเปกตรัมประสิทธิภาพให้
อัตราส่วนสัญญาณต่อเสียงรบกวน ( SNR ) ( เพิ่มเสียง , สีขาว ) ไม่ซีดจาง ) .
เราแสดงผลสองกรณี :
throughput สูงสุด ( จำนวนของการทำซ้ำและความซับซ้อนต่ำที่สุด )
( จํานวนซ้ำ ( 2 ) ลดความซับซ้อนของกระบวนการถอดรหัส
ผลลัพธ์ในการปฏิบัติการของ 1 – 2 dB .
ในรูป 4 ( b ) แสดงให้เราต้องคำนวณทรัพยากรสำหรับ
10 MHz 3GPP LTE ระบบ ต้องขอ
ขึ้นอยู่กับความซับซ้อน สมัครงาน ครั้งแรก มันเพิ่มตามจำนวน
ของบิตข้อมูลซึ่งแสดงถึงการเพิ่มขึ้นของ
ซับซ้อนลอการิทึม สมัครงาน ที่สอง , ความซับซ้อนมากขึ้นกับ
จำนวนซ้ำที่จำเป็นจะต้องมี codeword . โดย
แสดงใน [ 32 ] , ความซับซ้อนมากขึ้นด้วย
superlinearlyการลดสัญญาณรบกวน ( เดซิเบล ) สำหรับกำหนด MCS ในรูป 4 ( b )

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.