In computer science and information

In computer science and information theory, Huffman coding is an entropy encoding algorithm used for lossless data compression. The term refers to the use of a variable-length code table for encoding a source symbol (such as a character in a file) where the variable-length code table has been derived in a particular way based on the estimated probability of occurrence for each possible value of the source symbol. It was developed by David A. Huffman while he was a Ph.D. student at MIT, and published in the 1952 paper "A Method for the Construction of Minimum-Redundancy Codes".
Huffman coding uses a specific method for choosing the representation for each symbol, resulting in a prefix code (sometimes called "prefix-free codes", that is, the bit string representing some particular symbol is never a prefix of the bit string representing any other symbol) that expresses the most common source symbols using shorter strings of bits than are used for less common source symbols. Huffman was able to design the most efficient compression method of this type: no other mapping of individual source symbols to unique strings of bits will produce a smaller average output size when the actual symbol frequencies agree with those used to create the code.[citation needed] The running time of Huffman's method is fairly efficient, it takes O(n log n) operations to construct it. A method was later found to design a Huffman code in linear time if input probabilities (also known as weights) are sorted.[1]
For a set of symbols with a uniform probability distribution and a number of members which is a power of two, Huffman coding is equivalent to simple binary block encoding, e.g., ASCII coding. Huffman coding is such a widespread method for creating prefix codes that the term "Huffman code" is widely used as a synonym for "prefix code" even when such a code is not produced by Huffman's algorithm.
Although Huffman's original algorithm is optimal for a symbol-by-symbol coding (i.e. a stream of unrelated symbols) with a known input probability distribution, it is not optimal when the symbol-by-symbol restriction is dropped, or when the probability mass functions are unknown, not identically distributed, or not independent (e.g., "cat" is more common than "cta").[citation needed] Other methods such as arithmetic coding and LZW coding often have better compression capability: both of these methods can combine an arbitrary number of symbols for more efficient coding, and generally adapt to the actual input statistics, the latter of which is useful when input probabilities are not precisely known or vary significantly within the stream. However, the limitations of Huffman coding should not be overstated; it can be used adaptively, accommodating unknown, changing, or context-dependent probabilities. In the case of known independent and identically distributed random variables, combining symbols reduces inefficiency in a way that approaches optimality as the number of symbols combined increases.

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

ในวิทยาการคอมพิวเตอร์และทฤษฎีข้อมูลรหัส Huffman เป็นอัลกอริทึมการเข้ารหัสเอนโทรปีที่ใช้สำหรับการบีบอัดแบบไม่สูญเสียข้อมูลระยะหมายถึงการใช้งานของตารางรหัสตัวแปรความยาวสำหรับการเข้ารหัสสัญลักษณ์แหล่งที่มา (เช่นตัวละครในแฟ้ม) ที่ตารางรหัสตัวแปรความยาวได้รับมาในทางโดยเฉพาะอย่างยิ่งบนพื้นฐานของความน่าจะเป็นประมาณของการเกิดขึ้นสำหรับแต่ละ ค่าที่เป็นไปได้ของแหล่งที่มาของสัญลักษณ์ มันได้รับการพัฒนาโดยเดวิด Huffman ขณะที่เขาเป็นปริญญาเอก นักเรียนที่เอ็มไอทีและตีพิมพ์ในกระดาษ 1952 "วิธีการสำหรับการก่อสร้างของรหัสขั้นต่ำซ้ำซ้อน-".
รหัส Huffman ใช้วิธีการที่เฉพาะเจาะจงสำหรับการเลือกตัวแทนของแต่ละสัญลักษณ์ที่เกิดในรหัสคำนำหน้า (บางครั้งเรียกว่า "รหัสคำนำหน้าฟรี" ที่ คือบิตสตริงที่เป็นตัวแทนของสัญลักษณ์บางอย่างโดยเฉพาะอย่างยิ่งไม่เคยเป็นคำนำหน้าของสตริงบิตใด ๆ ที่เป็นตัวแทนของสัญลักษณ์อื่น) ที่แสดงสัญลักษณ์ที่พบมากที่สุดแหล่งที่มาของการใช้สายสั้นของบิตกว่าจะใช้สำหรับการร่วมกันน้อยลงแหล่งที่มาของสัญลักษณ์ Huffman ก็สามารถที่จะออกแบบวิธีการบีบอัดที่มีประสิทธิภาพมากที่สุดของประเภทนี้:ไม่มีการทำแผนที่อื่น ๆ ของสัญลักษณ์แหล่งที่มาของแต่ละสายไม่ซ้ำกันของบิตจะผลิตขนาดเอาท์พุทที่มีขนาดเล็กเฉลี่ยเมื่อความถี่สัญลักษณ์ที่เกิดขึ้นจริงเห็นด้วยกับผู้ที่ใช้ในการสร้างรหัส. [อ้างจำเป็น] เวลาการทำงานของวิธี Huffman เป็นที่มีประสิทธิภาพเป็นธรรมก็จะใช้เวลา o (n log n) การดำเนินงานที่จะสร้างมันวิธีการหลังจากพบว่าในการออกแบบรหัส Huffman ในเส้นเวลาถ้าความน่าจะเป็นอินพุท (ที่รู้จักกันว่าน้ำหนัก) จะถูกจัดเรียง. [1]
สำหรับการตั้งค่าของสัญลักษณ์ที่มีการกระจายความน่าจะเป็นเหมือนกันและจำนวนสมาชิกซึ่งเป็นอำนาจของสอง , รหัส Huffman เทียบเท่ากับไบนารีการเข้ารหัสง่ายบล็อกเช่นรหัส ASCIIรหัส Huffman เป็นเช่นวิธีการที่แพร่หลายสำหรับการสร้างรหัสคำนำหน้าว่าคำว่า "รหัส Huffman" ถูกนำมาใช้อย่างกว้างขวางว่าเป็นคำพ้องความหมายสำหรับ "รหัสคำนำหน้า" แม้ในขณะที่รหัสดังกล่าวไม่ได้รับการผลิตโดยขั้นตอนวิธี Huffman ของ.
แม้ว่าขั้นตอนวิธีเดิม Huffman เป็นที่เหมาะสมสำหรับการ สัญลักษณ์ตามสัญลักษณ์การเข้ารหัส (เช่นกระแสของสัญลักษณ์ที่ไม่เกี่ยวข้อง) ที่มีการกระจายความน่าจะเป็นที่รู้จักกันในการป้อนข้อมูล,มันไม่ได้ดีที่สุดเมื่อมีข้อ จำกัด สัญลักษณ์ตามสัญลักษณ์จะลดลงหรือเมื่อฟังก์ชั่นมวลความน่าจะเป็นไม่เป็นที่รู้จักไม่กระจายเหมือนกันหรือไม่ได้เป็นอิสระ (เช่น "แมว" เป็นพบได้บ่อยกว่า "CTA"). [อ้างจำเป็น] วิธีการอื่น ๆ เช่นเลขรหัสและการเข้ารหัส LZW มักจะมีความสามารถในการบีบอัดที่ดีกว่า:ทั้งสองวิธีการเหล่านี้สามารถรวมจำนวนข้อของสัญลักษณ์สำหรับการเข้ารหัสที่มีประสิทธิภาพมากขึ้นและโดยทั่วไปปรับให้เข้ากับสถิติการป้อนข้อมูลที่เกิดขึ้นจริงหลังจากที่มีประโยชน์เมื่อความน่าจะเป็นสัญญาณที่ไม่เป็นที่รู้จักอย่างแม่นยำหรือแตกต่างกันไปอย่างมีนัยสำคัญภายในกระแส แต่ข้อ จำกัด ของรหัส Huffman ไม่ควรจะคุยโว; มันสามารถนำมาใช้ปรับเปลี่ยนรองรับไม่ทราบการเปลี่ยนแปลงหรือน่าจะขึ้นอยู่กับบริบท ในกรณีที่เป็นที่รู้จักกันตัวแปรสุ่มที่เป็นอิสระและกันกระจายรวมสัญลักษณ์ช่วยลดการขาดประสิทธิภาพในทางที่ใกล้ optimality เป็นจำนวนของสัญลักษณ์ที่เพิ่มขึ้นรวมกัน

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

ในวิทยาการคอมพิวเตอร์และทฤษฎีสารสนเทศ ฮัฟเป็นอัลกอริธึมการเข้ารหัสเอนโทรปีใช้สำหรับการบีบอัดข้อมูลที่ดี คำหมายถึงการใช้ตารางตัวแปรความยาวรหัสสำหรับเข้ารหัสสัญลักษณ์แหล่ง (เช่นอักขระในแฟ้ม) ที่ความยาวตัวแปรรายได้รับมาในลักษณะเฉพาะตามน่าเกิดค่าแต่ละค่าที่เป็นไปได้ของสัญลักษณ์แหล่งประเมิน มันถูกพัฒนา โดยดาวิด A. Huffman ขณะเป็นนักศึกษาปริญญาเอกที่ MIT และเผยแพร่ใน 1952 กระดาษ "A รหัสวิธีการการก่อสร้างของซ้ำต่ำสุด"
ฮัฟแมนและใช้วิธีการเฉพาะสำหรับการเลือกสำหรับแต่ละสัญลักษณ์ ในรหัสนำหน้า (บางครั้งเรียก "เพิ่มนำหน้ารหัส" นั่นคือ การแสดง สายบิตที่แสดงสัญลักษณ์บางอย่างเฉพาะไม่นำหน้าของสายอักขระบิตแทนสัญลักษณ์อื่น ๆ) ซึ่งแสดงสัญลักษณ์แหล่งทั่วไปที่ใช้สายสั้นของบิตมากกว่าใช้สัญลักษณ์ต้นน้อยทั่วไป Huffman ได้ออกแบบวิธีการบีบอัดมีประสิทธิภาพสูงสุดของชนิดนี้: ไม่แม็ปอื่น ๆ ของสัญลักษณ์แต่ละแหล่งเพื่อสตริงที่ไม่ซ้ำกันของบิตจะผลิตขนาดผลเฉลี่ยเมื่อความถี่สัญลักษณ์จริงเห็นด้วยกับผู้ใช้ในการสร้างรหัส[ต้องการอ้างอิง] เวลาทำงานของวิธีการของ Huffman ค่อนข้างมีประสิทธิภาพ ใช้เวลา O (n n log) การดำเนินงานสร้างมัน หลังพบวิธีการออกแบบรหัส Huffman ในเวลาเชิงเส้นถ้าเรียงลำดับกิจกรรมเข้า (เรียกอีกอย่างว่าน้ำหนัก)[1]
สำหรับชุดของสัญลักษณ์กับการกระจายความน่าเป็นเครื่องแบบและจำนวนสมาชิกซึ่งเป็นกำลังของสอง ฮัฟ จะเทียบเท่ากับเรื่องบล็อกไบนารีเข้ารหัส เช่น ASCII รหัส รหัสฮัฟแมนเป็นวิธีแพร่หลายสำหรับการสร้างรหัสคำนำหน้าที่คำว่า "รหัส Huffman" อย่างกว้างขวางใช้เป็นคำเหมือนสำหรับ "รหัสคำนำหน้า" แม้เมื่อจัดไม่ผลิต โดยอัลกอริทึมของ Huffman.
แม้ Huffman ของอัลกอริทึมเดิมเหมาะสำหรับสัญลักษณ์โดยสัญลักษณ์รหัส (เช่นกระแสของสัญลักษณ์ไม่เกี่ยวข้อง) กับการรู้จักป้อนความกระจาย ไม่เหมาะสม เมื่อหลุดข้อจำกัดสัญลักษณ์โดยสัญลักษณ์ หรือ เมื่อมีฟังก์ชันความน่าเป็นมวลไม่รู้จัก กระจาย ไม่ตรง หรือไม่เป็นอิสระ ("เช่น แมว" อยู่ทั่วไปกว่า "cta")[ต้องการอ้างอิง] วิธีการอื่น ๆ เช่นคณิตศาสตร์การเขียนโค้ดและโค้ด LZW มักจะมีความสามารถในการบีบอัดดีกว่า: ทั้งสองวิธีสามารถรวมหมายเลขกำหนดสัญลักษณ์ในการเขียนรหัสที่มีประสิทธิภาพมากขึ้น และโดยทั่วไปปรับใช้กับสถิติเข้าจริง หลังซึ่งจะเป็นประโยชน์ เมื่อเข้ากิจกรรมทุกประการไม่ทราบว่าแตกต่างกันอย่างมีนัยสำคัญภายในสตรีม เทียบกับใบอย่างไรก็ตาม ข้อจำกัดของฮัฟควรไม่สั่ง สามารถใช้อย่างเหมาะ ไม่รู้จักพัก เปลี่ยนแปลง หรือกิจกรรมขึ้นอยู่กับบริบท ในกรณีที่รู้จักอิสระ และกระจายเหมือนกันสุ่มแปร รวมสัญลักษณ์ลด inefficiency ที่ยื่น optimality เช่นจำนวนของสัญลักษณ์โดยรวมเพิ่มขึ้น

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

ในทางทฤษฎีวิทยาศาสตร์คอมพิวเตอร์และข้อมูล Huffman coding สามารถนำมาเป็นอัลกอริธึมการเข้ารหัสระดับ Entropy ที่ใช้สำหรับการบีบอัดแบบไม่สูญเสียข้อมูลคำนี้ก็หมายถึงการใช้ตารางรหัสแบบปรับได้หลายระดับความยาวที่สำหรับการเข้ารหัสสัญลักษณ์แหล่งที่มา(เช่นตัวอักษรที่อยู่ในไฟล์)สถานที่ซึ่งตารางรหัสแบบปรับได้หลายระดับความยาวที่ได้รับการมาในลักษณะเฉพาะที่ใช้ความเป็นไปได้คาดว่าจะเกิดขึ้นสำหรับความคุ้มค่าของแต่ละคนเป็นไปได้ของ Symbol แหล่งที่มา โรงแรมได้รับการพัฒนามาจากดาวิด A . Huffman coding สามารถนำมาในขณะที่เขาเป็นนักเรียนผู้เชี่ยวชาญที่สถาบัน MITและจะมีการประกาศในปี 1952 "วิธีสำหรับการก่อสร้าง minimum-redundancy รหัส"..การเข้ารหัส
Huffman coding สามารถนำมาใช้วิธีเฉพาะสำหรับการเลือกตัวแทนของสัญลักษณ์แต่ละรหัสส่งผลให้ในหน้าที่(บางครั้งเรียกว่า"รหัส - - แบบไม่เสียค่าบริการ"ซึ่งเป็นสตริงบิตที่แสดงให้เห็นถึงสัญลักษณ์เฉพาะบางคนไม่เคยมีอุปสรรคของสตริงบิตที่เป็นตัวแทนสัญลักษณ์อื่นๆ)ที่กล่าวว่าสัญลักษณ์ที่ใช้กันโดยทั่วไปการใช้สตริงสั้นลงของบิตมากกว่าใช้สำหรับแหล่งที่มาน้อยสัญลักษณ์ทั่วไป Huffman coding สามารถนำมาทำให้มีการออกแบบส่วนใหญ่วิธีการบีบอัด ประสิทธิภาพ ที่เพิ่มขึ้นใน ประเภท นี้ไม่มีการทำแผนที่อื่นๆของแต่ละบุคคลที่สัญลักษณ์เพื่อที่โดดเด่นสตริงของบิตจะผลิตที่มีขนาดเล็กลงโดยเฉลี่ยเอาต์พุตขนาดจริงเมื่อสัญลักษณ์ความถี่เห็นด้วยกับที่ใช้ในการสร้างรหัส[คุณงามความดีต่อสาธารณชน]ที่ใช้เวลาของ Huffman coding สามารถนำมาเป็นวิธีการมีขนาดค่อนข้างมี ประสิทธิภาพ ,ระบบจะใช้เวลา O ( N ล็อกอินเข้าสู่ n )การดำเนินการที่จะสร้างมัน.วิธีการในเวลาต่อมาพบว่าเป็นการออกแบบที่ Huffman coding สามารถนำมาในแนวเส้นตรงเวลาหากอินพุตความน่าจะเป็น(นอกจากนั้นยังรู้จักกันในชื่อเครื่องยกน้ำหนัก)จะเรียงลำดับ.[ 1 ]
สำหรับที่ตั้งของสัญลักษณ์ด้วยเครื่องแบบโอกาสและการจัดจำหน่ายที่จำนวนของสมาชิกซึ่งเป็นอำนาจของสอง, Huffman coding สามารถนำมาการเข้ารหัสมีค่าเท่ากับแบบเรียบง่ายไบนารีบล็อกการเข้ารหัส,เช่น,การเข้ารหัสอักขระ ASCII จำนวน.Huffman coding สามารถนำมาเป็นการเข้ารหัสเช่นที่เกิดขึ้นอย่างแพร่หลายวิธีการสำหรับการสร้าง - รหัสที่คำว่า" Huffman coding สามารถนำมา"ได้รับการยอมรับอย่างกว้างขวางใช้เป็นที่มีความหมายเหมือนกันสำหรับ"นำรหัส"แม้ในขณะที่เป็นรหัสไม่ได้ผลิตโดย Huffman coding สามารถนำมาของอัลกอริธึม.
แม้ว่า Huffman coding สามารถนำมาเป็นแบบดั้งเดิมเป็นวิธีที่ดีที่สุดสำหรับอัลกอริธึมที่สัญลักษณ์ - โดยมีสัญลักษณ์การเข้ารหัส(เช่นที่สตรีมของไม่เกี่ยวข้องสัญลักษณ์)พร้อมด้วยอินพุตความเป็นไปได้ที่มีชื่อเสียงการกระจายไม่ได้ดีที่สุดเมื่อสัญลักษณ์ - โดยมีสัญลักษณ์การจำกัดจะลดลง,หรือเมื่อมีโอกาสการทำงานจะไม่รู้จักและไม่เหมือนกันการกระจายหรือไม่(เช่น"แมว"เป็นเรื่องธรรมดามากกว่า" CTA :")[คุณงามความดีต่อสาธารณชน]วิธีการอื่นๆเช่น arithmetic coding lzw และการเข้ารหัสโดยส่วนใหญ่จะมีความสามารถในการบีบอัดได้ดียิ่งขึ้น:ทั้งสองวิธีนี้สามารถรวมทั้งจำนวนตาม อำเภอ ใจที่มีสัญลักษณ์สำหรับการเข้ารหัสอย่างมี ประสิทธิภาพ มากขึ้นและโดยทั่วไปแล้วอยู่ปรับตัวเข้ากับสถิติอินพุตจริงหลังของซึ่งจะเป็นประโยชน์เมื่อความน่าจะเป็นอินพุตไม่ได้อย่างแม่นยำซึ่งรู้จักกันในชื่อแตกต่างกันไปอย่างมีนัยสำคัญหรือสตรีมที่อยู่ ภายใน แต่ถึงอย่างไรก็ตามข้อจำกัดของการเข้ารหัส Huffman coding สามารถนำมาไม่ควรสักนิดก็สามารถใช้ adaptively สามารถรองรับผู้ใช้บริการที่ไม่รู้จักการเปลี่ยนหรือความน่าจะเป็นแบบคอนเท็กซ์เซนซิทีฟขึ้นอยู่กับ ในกรณีที่มีตัวแปรแบบสุ่มและเป็นอิสระเหมือนกันแบบกระจายที่มีชื่อเสียงด้วยการผสมผสานสัญลักษณ์ช่วยลดขาด ประสิทธิภาพ ในทางที่วิธีการกุมจำนวนที่เพิ่มขึ้นของสัญลักษณ์รวม

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.