Lossless compression algorithms and their implementations are routinely tested in head-to-head benchmarks. There are a number of better-known compression benchmarks. Some benchmarks cover only the data compression ratio, so winners in these benchmarks may be unsuitable for everyday use due to the slow speed of the top performers. Another drawback of some benchmarks is that their data files are known, so some program writers may optimize their programs for best performance on a particular data set. The winners on these benchmarks often come from the class of context-mixing compression software.
The benchmarks listed in the 5th edition of the Handbook of Data Compression (Springer, 2009) are:[3]
The Maximum Compression benchmark, started in 2003 and updated until November 2011, includes over 150 programs. Maintained by Werner Bergmans, it tests on a variety of data sets, including text, images, and executable code. Two types of results are reported: single file compression (SFC) and multiple file compression (MFC). Not surprisingly, context mixing programs often win here; programs from the PAQ series and WinRK often are in the top. The site also has a list of pointers to other benchmarks.[4]
UCLC (the ultimate command-line compressors) benchmark by Johan de Bock is another actively maintained benchmark including over 100 programs. The winners in most tests usually are PAQ programs and WinRK, with the exception of lossless audio encoding and grayscale image compression where some specialized algorithms shine.
Squeeze Chart by Stephan Busch is another frequently updated site.
The EmilCont benchmarks by Berto Destasio are somewhat outdated having been most recently updated in 2004. A distinctive feature is that the data set is not public, to prevent optimizations targeting it specifically. Nevertheless, the best ratio winners are again the PAQ family, SLIM and WinRK.
The Archive Comparison Test (ACT) by Jeff Gilchrist included 162 DOS/Windows and 8 Macintosh lossless compression programs, but it was last updated in 2002.
The Art Of Lossless Data Compression by Alexander Ratushnyak provides a similar test performed in 2003.
Matt Mahoney, in his February 2010 edition of the free booklet Data Compression Explained, additionally lists the following:[5]
The Calgary Corpus dating back to 1987 is no longer widely used due to its small size, although Leonid A. Broukhis still maintains The Calgary Corpus Compression Challenge, which started in 1996.
The Large Text Compression Benchmark and the similar Hutter Prize both use a trimmed Wikipedia XML UTF-8 data set.
The Generic Compression Benchmark, maintained by Mahoney himself, test compression on random data.
Sami Runsas (author of NanoZip) maintains Compression Ratings, a benchmark similar to Maximum Compression multiple file test, but with minimum speed requirements. It also offers a calculator that allows the user to weight the importance of speed and compression ratio. The top programs here are fairly different due to speed requirement. In January 2010, the top programs were NanoZip followed by FreeArc, CCM, flashzip, and 7-Zip.
The Monster of Compression benchmark by N. F. Antonio tests compression on 1Gb of public data with a 40 minute time limit. As of Dec. 20, 2009 the top ranked archiver is NanoZip 0.07a and the top ranked single file compressor is ccmx 1.30c, both context mixing.
Compression Ratings publishes a chart summary of the "frontier" in compression ratio and time.
Lossless กลไกการบีบอัดและการใช้งานของพวกเขาได้รับการทดสอบเป็นประจำในมาตรฐานหัวเพื่อหัว มีจำนวนของมาตรฐานการบีบอัดที่ดีกว่าที่รู้จักกันเป็น มาตรฐานบางครอบคลุมเฉพาะอัตราการบีบอัดข้อมูลเพื่อให้ผู้โชคดีในมาตรฐานเหล่านี้อาจจะไม่เหมาะสมสำหรับการใช้ชีวิตประจำวันเนื่องจากความเร็วช้าของนักแสดงชั้นนำ ข้อเสียเปรียบของมาตรฐานบางอย่างก็คือว่าไฟล์ข้อมูลของพวกเขาเป็นที่รู้จักกันเพื่อให้นักเขียนโปรแกรมบางอย่างอาจเพิ่มประสิทธิภาพโปรแกรมของพวกเขาสำหรับการทำงานที่ดีที่สุดในชุดข้อมูลโดยเฉพาะอย่างยิ่ง ผู้โชคดีเกี่ยวกับการวัดเหล่านี้มักจะมาจากชั้นเรียนของซอฟต์แวร์การบีบอัดบริบทผสม. มาตรฐานที่ระบุไว้ในฉบับที่ 5 ของคู่มือของการบีบอัดข้อมูล (สปริงเกอร์, 2009) มีดังนี้: [3] มาตรฐานการบีบอัดสูงสุดเริ่มต้นในปี 2003 และมีการปรับปรุง จนถึงเดือนพฤศจิกายน 2011, รวมกว่า 150 โปรแกรม การเก็บรักษาโดยเวอร์เนอร์ Bergmans ก็ทดสอบบนความหลากหลายของชุดข้อมูลรวมถึงข้อความ, ภาพ, และรหัสปฏิบัติการ สองประเภทของผลจะมีการรายงาน: การบีบอัดไฟล์เดียว (SFC) และการบีบอัดไฟล์หลาย (MFC) ไม่น่าแปลกใจโปรแกรมผสมบริบทมักจะชนะที่นี่; โปรแกรมจากชุด PAQ และ WinRK มักจะอยู่ในด้านบน เว็บไซต์นี้ยังมีรายชื่อของตัวชี้ไปยังมาตรฐานอื่น ๆ . [4] UCLC (สุดยอดอัดบรรทัดคำสั่ง) มาตรฐานโดยโยฮันเดอเบียร์เป็นมาตรฐานการบำรุงรักษาอย่างแข็งขันอีกรวมกว่า 100 โปรแกรม ผู้โชคดีในการทดสอบส่วนใหญ่มักจะเป็นโปรแกรม PAQ และ WinRK ด้วยข้อยกเว้นของการเข้ารหัสเสียง lossless และการบีบอัดภาพสีเทาที่ขั้นตอนวิธีการเฉพาะบางส่องแสง. บีบแผนภูมิโดยสเตฟานบุชเป็นอีกหนึ่งการปรับปรุงบ่อยเว็บไซต์. มาตรฐาน EmilCont โดย Berto Destasio จะค่อนข้างล้าสมัยมี ได้รับการปรับปรุงมากที่สุดเมื่อเร็ว ๆ นี้ในปี 2004 คุณสมบัติที่โดดเด่นคือชุดข้อมูลที่ไม่ใช่ข้อมูลสาธารณะเพื่อป้องกันการเพิ่มประสิทธิภาพการกำหนดเป้าหมายมันโดยเฉพาะ อย่างไรก็ตามผู้ชนะอัตราส่วนที่ดีที่สุดอีกครั้งในครอบครัว PAQ บางและ WinRK. คลังเปรียบเทียบการทดสอบ (ACT) โดยเจฟกิลคริสต์รวม 162 DOS / Windows และ Macintosh 8 โปรแกรมบีบอัด lossless แต่มันก็ปรับปรุงล่าสุดในปี 2002. ศิลปะของ Lossless การบีบอัดข้อมูลโดยอเล็กซานเด Ratushnyak ให้ผลการทดสอบที่คล้ายกันดำเนินการในปี 2003. แมตต์ฮอนี่ย์ในเดือนกุมภาพันธ์ปี 2010 ของเขาในหนังสือเล่มเล็กฟรีการบีบอัดข้อมูลอธิบายนอกจากนี้รายการดังต่อไปนี้: [5] คัลคอร์ปัสย้อนหลังไปถึงปี 1987 ไม่ได้ใช้กันอย่างแพร่หลายเนื่องจาก ขนาดที่เล็กแม้ว่า Leonid A. Broukhis ยังคงรักษาคัลคอร์ปัสอัดท้าทายซึ่งเริ่มต้นในปี 1996. เกณฑ์มาตรฐานการบีบอัดขนาดใหญ่และข้อความที่คล้ายกัน Hutter รางวัลทั้งสองใช้ตัดวิกิพีเดีย XML UTF-8 ชุดข้อมูล. เกณฑ์มาตรฐานการบีบอัดทั่วไป การเก็บรักษาโดยฮอนี่ย์ตัวเอง, การบีบอัดการทดสอบข้อมูลแบบสุ่ม. เซ Runsas (ผู้เขียน NanoZip) ยังคงนิยมการบีบอัด, มาตรฐานคล้ายกับการบีบอัดสูงสุดทดสอบไฟล์หลาย แต่ด้วยความต้องการความเร็วขั้นต่ำ นอกจากนี้ยังมีเครื่องคิดเลขที่ช่วยให้ผู้ใช้ที่จะมีน้ำหนักความสำคัญของความเร็วและอัตราการบีบอัด โปรแกรมด้านบนที่นี่จะค่อนข้างแตกต่างกันเนื่องจากความต้องการความเร็ว ในเดือนมกราคม 2010, โปรแกรมด้านบนถูก NanoZip ตามด้วย FreeArc, CCM, flashzip และ 7-Zip. มอนสเตอร์ของมาตรฐานการบีบอัดโดย NF อันโตนิโอทดสอบการบีบอัดใน 1Gb ของข้อมูลของประชาชนที่มีกำหนดเวลา 40 นาที ณ วันที่ 20 ธันวาคม 2009 การจัดอันดับบน Archiver เป็น 0.07A NanoZip และติดอันดับยอดคอมเพรสเซอร์ไฟล์เดียวเป็น CCMX 1.30c บริบททั้งผสม. นิยมบีบอัดเผยแพร่สรุปผัง "ชายแดน" ในอัตราการบีบอัดและเวลา
การแปล กรุณารอสักครู่..
ขั้นตอนวิธีการบีบอัด lossless และการใช้งานของพวกเขาตรวจทดสอบในหัวเพื่อหัววัด มีหลายที่รู้จักกันดีการบีบอัดมาตรฐาน . บาง บริษัท ครอบคลุมเฉพาะข้อมูลอัตราการบีบอัด ดังนั้นผู้ชนะในมาตรฐานเหล่านี้อาจจะไม่เหมาะสมสำหรับใช้ในชีวิตประจำวัน เนื่องจากความเร็วของนักแสดงชั้นนำข้อเสียเปรียบอีกบางมาตรฐานคือ ไฟล์ข้อมูลของพวกเขาเป็นที่รู้จักกันเพื่อให้มีนักเขียนโปรแกรมอาจปรับโปรแกรมของพวกเขาสำหรับการแสดงที่ยอดเยี่ยมในหนึ่งชุดข้อมูล ผู้ชนะในมาตรฐานเหล่านี้มักจะมาจากชั้นเรียนบริบทของการผสมซอฟต์แวร์การบีบอัด
มาตรฐานที่ระบุไว้ในรุ่นที่ 5 ของคู่มือการบีบอัดข้อมูล ( Springer , 2009 ) : [ 3 ]
มาตรฐานการบีบอัดสูงสุดที่เริ่มต้นในปี 2003 และปรับปรุงจนถึงพฤศจิกายน 2554 รวมกว่า 150 รายการ ดูแลโดย เวอร์เนอร์ bergmans ก็ทดสอบในความหลากหลายของชุดข้อมูลรวมทั้งข้อความ , ภาพ , และปฏิบัติการรหัส สองประเภทของผลลัพธ์รายงาน : การบีบอัดไฟล์เดียว ( SFC ) และการบีบอัดไฟล์หลาย ( MFC ) ไม่น่าแปลกใจ , บริบทผสมโปรแกรมมักจะชนะที่นี่โปรแกรมจาก PAQ ชุดและ winrk มักจะอยู่ด้านบน เว็บไซต์ยังมีรายการของตัวชี้วัดอื่น ๆ . [ 4 ]
uclc ( คอมเพรสเซอร์บรรทัดคำสั่งสุดท้าย ) เกณฑ์มาตรฐานโดย Johan de ซูริกเป็นอีกการรักษาอย่างมาตรฐานรวมกว่า 100 โปรแกรม ผู้ชนะการทดสอบส่วนใหญ่มักจะมีโปรแกรม และ winrk PAQ ,ยกเว้นเสียงและภาพการบีบอัดการเข้ารหัสระดับสีเทาที่พิเศษบางขั้นตอนวิธีท้า lossless .
บีบแผนภูมิโดยสตีเฟ่นบุชเป็นอีกหนึ่งการปรับปรุงบ่อยของเว็บไซต์ emilcont
มาตรฐานโดย เบอร์โต destasio ค่อนข้างล้าสมัยได้รับการปรับปรุงล่าสุดในปี 2004 คุณสมบัติเด่นคือ ชุดข้อมูลไม่ใช่ที่สาธารณะเพื่อป้องกันการเพิ่มประสิทธิภาพเป้าหมายนั้นโดยเฉพาะ อย่างไรก็ตาม อัตราส่วนที่ดีที่สุดเป็นผู้ชนะอีกครั้งครอบครัว PAQ , บางและ winrk .
เก็บการทดสอบเปรียบเทียบ ( Act ) โดย Jeff กิลคริสต์รวม 162 DOS / Windows และ Macintosh โปรแกรมการบีบอัดข้อมูลแบบไม่สูญเสีย แต่มันเป็นครั้งสุดท้ายในปี 2002
ศิลปะของการบีบอัดข้อมูลโดย Alexander ratushnyak ให้คล้ายๆแบบทดสอบในปี 2003 .
แมท มาโฮนี่ ในของเขา กุมภาพันธ์ 2010 รุ่นของการบีบอัดข้อมูลหนังสือฟรีอธิบาย นอกจากนี้รายการต่อไปนี้ : [ 5 ]
คัลคลังข้อมูลย้อนกลับไปปี 2530 ไม่ใช้กันอย่างแพร่หลาย เนื่องจากมีขนาดเล็ก แต่ลีโอนิด . broukhis ยังคงรักษาคัลคลังข้อมูลการท้าทาย ซึ่งเริ่มต้นในปี 1996
ขนาดใหญ่การบีบอัดข้อความมาตรฐานและที่คล้ายกัน HUTTER รางวัลทั้งสองใช้ตัดวิกิพีเดีย XML UTF - 8 ชุดข้อมูล .
มาตรฐานการบีบอัดทั่วไป ดูแลโดยมาโฮนี่เอง ทดสอบการบีบอัดข้อมูลแบบสุ่ม runsas
เซ ( ผู้เขียน nanozip ) รักษาอันดับการบีบอัด , การบีบอัดหลายไฟล์สูงสุดมาตรฐานคล้ายกับการทดสอบ แต่กับความต้องการความเร็วต่ำสุด .นอกจากนี้ยังมีเครื่องคิดเลขช่วยให้ผู้ใช้น้ำหนักความสำคัญของความเร็วและอัตราการบีบอัด โปรแกรมด้านบนนี้จะแตกต่างกันค่อนข้าง เนื่องจากความเร็วของความต้องการ ในเดือนมกราคม 2010 , โปรแกรมด้านบนเป็น nanozip ตาม freearc CCM flashzip , , , และแก้ไข .
มอนสเตอร์ของการบีบอัดมาตรฐานโดย . . นทดสอบ 1GB ของข้อมูลสาธารณะด้วยเวลา 40 นาทีที่กำหนดที่ 20 ธันวาคม 2009 ด้านบนการจัดอันดับ Archiver เป็น 0.07a nanozip และด้านบนการจัดอันดับคอมเพรสเซอร์ไฟล์เดียวคือ ccmx 1.30c ทั้งบริบทผสม การประกาศจัดอันดับ
แผนภูมิสรุปของ " แดน " ในอัตราส่วนการบีบอัด และ เวลา
การแปล กรุณารอสักครู่..