Multiple sequence alignment (MSA) is an extremely useful tool for molecular and
evolutionary biology and there are several programs and algorithms available for this
purpose. Although previous studies have compared the alignment accuracy of different MSA
programs, their computational time and memory usage have not been systematically
evaluated. Given the unprecedented amount of data produced by next generation deep
sequencing platforms, and increasing demand for large-scale data analysis, it is imperative to
optimize the application of software. Therefore, a balance between alignment accuracy and
computational cost has become a critical indicator of the most suitable MSA program. We
compared both accuracy and cost of nine popular MSA programs, namely CLUSTALW,
CLUSTAL OMEGA, DIALIGN-TX, MAFFT, MUSCLE, POA, Probalign, Probcons and TCoffee,
against the benchmark alignment dataset BAliBASE and discuss the relevance of
some implementations embedded in each program’s algorithm. Accuracy of alignment was
calculated with the two standard scoring functions provided by BAliBASE, the sum-of-pairs
ลำดับการจัดเรียงหลาย (MSA) เป็นเครื่องมือที่มีประโยชน์อย่างยิ่งสำหรับโมเลกุลและ
ชีววิทยาวิวัฒนาการและมีหลายโปรแกรมและขั้นตอนวิธีนี้สามารถใช้ได้สำหรับ
วัตถุประสงค์ ถึงแม้ว่าการศึกษาก่อนหน้านี้ได้เมื่อเทียบกับความถูกต้องของการจัดตำแหน่งที่แตกต่างกัน MSA
โปรแกรมคำนวณเวลาของพวกเขาและการใช้งานหน่วยความจำที่ไม่ได้รับการระบบ
การประเมิน ป.ร. ให้ไว้จำนวนประวัติการณ์ของข้อมูลที่ผลิตโดยรุ่นถัดไปลึก
แพลตฟอร์มลำดับและความต้องการที่เพิ่มขึ้นสำหรับการวิเคราะห์ข้อมูลขนาดใหญ่ก็มีความจำเป็นที่จะ
เพิ่มประสิทธิภาพการประยุกต์ใช้ซอฟแวร์ ดังนั้นความสมดุลระหว่างความถูกต้องจัดตำแหน่งและ
ค่าใช้จ่ายในการคำนวณได้กลายเป็นตัวบ่งชี้ที่สำคัญของโปรแกรม MSA ที่เหมาะสมที่สุด เรา
เมื่อเทียบทั้งความถูกต้องและค่าใช้จ่ายของเก้าโปรแกรม MSA นิยมคือ ClustalW,
Clustal OMEGA, DIALIGN-TX, MAFFT กล้ามเนื้อรถ, Probalign, Probcons และ TCoffee,
กับชุดข้อมูลที่การจัดตำแหน่งมาตรฐาน BAliBASE และหารือเกี่ยวกับความเกี่ยวข้องของ
การใช้งานบางอย่างที่ฝังอยู่ในแต่ละ อัลกอริทึมของโปรแกรม ความถูกต้องของการจัดตำแหน่งได้รับการ
คำนวณกับทั้งสองฟังก์ชั่นการให้คะแนนมาตรฐานการให้บริการโดย BAliBASE, คู่ sum-of-
การแปล กรุณารอสักครู่..

หลายลำดับฟี ( MSA ) เป็นเครื่องมือที่มีประโยชน์อย่างมากสำหรับโมเลกุลและ
วิวัฒนาการชีววิทยาและมีหลายโปรแกรมและขั้นตอนวิธีที่มีอยู่เพื่อวัตถุประสงค์นี้
แม้ว่าการศึกษาก่อนหน้านี้ได้เชื่อมโยงกับความถูกต้องของโปรแกรม msa
แตกต่างกันเวลาการคำนวณและการใช้หน่วยความจำได้อย่างเป็นระบบ
ประเมินระบุจำนวนประวัติการณ์ของข้อมูลที่ผลิตโดยแพลตฟอร์มรุ่นถัดไปลึก
sequencing และความต้องการเพิ่มขึ้นสำหรับการวิเคราะห์ข้อมูลขนาดใหญ่ ขวาง
เพิ่มประสิทธิภาพการประยุกต์ใช้ซอฟต์แวร์ ดังนั้น การจัดสมดุลระหว่างความถูกต้องและคอมพิวเตอร์ได้กลายเป็นตัวบ่งชี้
ต้นทุนสำคัญของโปรแกรมการปรับปรุงที่เหมาะสมที่สุด เรา
เทียบทั้งความถูกต้องและต้นทุนของเก้าโปรแกรม MSA ที่นิยมคือ clustalw
clustal , Omega , dialign-tx mafft , กล้ามเนื้อ , POA , probalign probcons tcoffee , และ , มาตรฐานการ balibase
กับข้อมูลและหารือเกี่ยวกับความเกี่ยวข้องของ
บางซึ่งฝังตัวอยู่ในขั้นตอนวิธีของโปรแกรมแต่ละ ความถูกต้องของแนวร่วมคือ
การคำนวณด้วยสองมาตรฐานการให้คะแนนโดย balibase ฟังก์ชั่น ,ผลรวมของคู่
การแปล กรุณารอสักครู่..
