Comparative analysis of DNA and amino acid sequences is an increasingly important component of biological research. Sequence alignment, in particular, has been helpful in the study of molecular evolution (1), RNA folding (2), gene regulation (3), and protein structure-function relationships (4). Although pairwise sequence comparisons have proven useful, for example, in data base searches (5, 6), some biologically significant similarities may only be detected by aligning a set of sequences (7, 8). Likewise, patterns or motifs common to a set of functionally related proteins may only be apparent from analysis of a multiple alignment of these sequences (9). To align a pair of sequences, one must have a notion of what makes one possible alignment better than another: a measure of the quality of an alignment. Although there are many programs available for pairwise sequence alignment, the most widely accepted tools use variations of the dynamic programming method (10-13). These methods use an explicit measure of alignment quality, consisting of defined costs for aligned pairs of residues, or residues with gaps, and use an algorithm for finding an alignment with minimum total cost. Extending these methods to multiple sequences poses a number of problems, among which are how to measure the cost of a multiple alignment and how to choose gap costs consistent with the measure chosen (14). The biggest obstacle to using dynamic programming for multiple sequence alignment, however, has been the computational requirements of the method; those tools that do use dynamic programming have been limited to aligning no more than three sequences (15, 16). Given these difficulties, most alternative multiple alignment programs use heuristics or minimize alignment costs that are not clearly tied to models of molecular evolution (17-22). As such, they lack an explicit overall measure of alignment quality. Recently, how- ever, methods have been proposed to greatly reduce the computational demands of dynamic programming applied to multiple sequence alignment (23, 24). We describe the design and application of a tool for multiple sequence alignment that implements these methods.
 
Comparative analysis of DNA and amino acid sequences is an increasingly important component of biological research. Sequence alignment, in particular, has been helpful in the study of molecular evolution (1), RNA folding (2), gene regulation (3), and protein structure-function relationships (4). Although pairwise sequence comparisons have proven useful, for example, in data base searches (5, 6), some biologically significant similarities may only be detected by aligning a set of sequences (7, 8). Likewise, patterns or motifs common to a set of functionally related proteins may only be apparent from analysis of a multiple alignment of these sequences (9). To align a pair of sequences, one must have a notion of what makes one possible alignment better than another: a measure of the quality of an alignment. Although there are many programs available for pairwise sequence alignment, the most widely accepted tools use variations of the dynamic programming method (10-13). These methods use an explicit measure of alignment quality, consisting of defined costs for aligned pairs of residues, or residues with gaps, and use an algorithm for finding an alignment with minimum total cost. Extending these methods to multiple sequences poses a number of problems, among which are how to measure the cost of a multiple alignment and how to choose gap costs consistent with the measure chosen (14). The biggest obstacle to using dynamic programming for multiple sequence alignment, however, has been the computational requirements of the method; those tools that do use dynamic programming have been limited to aligning no more than three sequences (15, 16). Given these difficulties, most alternative multiple alignment programs use heuristics or minimize alignment costs that are not clearly tied to models of molecular evolution (17-22). As such, they lack an explicit overall measure of alignment quality. Recently, how- ever, methods have been proposed to greatly reduce the computational demands of dynamic programming applied to multiple sequence alignment (23, 24). We describe the design and application of a tool for multiple sequence alignment that implements these methods.
การแปล กรุณารอสักครู่..

 
 
 
การวิเคราะห์เปรียบเทียบดีเอ็นเอและลำดับกรดอะมิโนเป็นองค์ประกอบที่สำคัญมากขึ้นของการวิจัยทางชีววิทยา การจัดเรียงลำดับโดยเฉพาะอย่างยิ่งได้รับประโยชน์ในการศึกษาวิวัฒนาการของโมเลกุล (1), RNA พับ (2), การควบคุมยีน (3) และความสัมพันธ์โปรตีนโครงสร้างและหน้าที่ (4) แม้ว่าการเปรียบเทียบลำดับคู่ได้พิสูจน์แล้วว่ามีประโยชน์เช่นในการค้นหาฐานข้อมูล (5, 6) บางส่วนคล้ายคลึงกันอย่างมีนัยสำคัญทางชีวภาพอาจถูกตรวจพบเพียงโดยจัดชุดของลำดับ (7, 8) ในทำนองเดียวกันรูปแบบหรือลวดลายธรรมดาที่จะมีชุดของโปรตีนที่เกี่ยวข้องกับการทำงานอาจจะเป็นแค่ที่เห็นได้ชัดจากการวิเคราะห์ของการจัดตำแหน่งหลายลำดับเหล่านี้ (9) เพื่อให้สอดคล้องคู่ของลำดับหนึ่งต้องมีความคิดของสิ่งที่ทำให้การจัดตำแหน่งหนึ่งที่เป็นไปได้ดีกว่าอีก: ตัวชี้วัดคุณภาพของการจัดตำแหน่ง แม้ว่าจะมีหลายโปรแกรมพร้อมใช้งานสำหรับลำดับการจัดเรียงคู่, เครื่องมือที่ได้รับการยอมรับอย่างกว้างขวางใช้รูปแบบของวิธีการเขียนโปรแกรมแบบไดนามิก (10-13) วิธีการเหล่านี้ใช้ตัวชี้วัดที่ชัดเจนของการจัดตำแหน่งที่มีคุณภาพซึ่งประกอบด้วยค่าใช้จ่ายที่กำหนดไว้สำหรับคู่ชิดของสารตกค้างหรือสารตกค้างที่มีช่องว่างและใช้อัลกอริทึมสำหรับการค้นหาสอดคล้องกับค่าใช้จ่ายรวมต่ำสุด ขยายวิธีการเหล่านี้จะวนเวียนอยู่หลาย poses จำนวนของปัญหาในระหว่างที่มีวิธีการวัดค่าใช้จ่ายในการจัดตำแหน่งหลายและวิธีการเลือกช่องว่างค่าใช้จ่ายที่สอดคล้องกับตัวชี้วัดที่เลือก (14) อุปสรรคที่ใหญ่ที่สุดในการใช้การเขียนโปรแกรมแบบไดนามิกสำหรับลำดับการจัดเรียงหลาย แต่ได้รับการคำนวณความต้องการของวิธีการ; เครื่องมือที่จะใช้ในการเขียนโปรแกรมแบบไดนามิกได้รับการ จำกัด ในการจัดตำแหน่งไม่เกินสามลำดับ (15, 16) ที่ได้รับความยากลำบากเหล่านี้ทางเลือกที่มากที่สุดโปรแกรมการจัดตำแหน่งหลายใช้วิเคราะห์พฤติกรรมหรือลดค่าใช้จ่ายในการจัดตำแหน่งที่ไม่ได้เชื่อมโยงอย่างชัดเจนกับรูปแบบของการวิวัฒนาการโมเลกุล (17-22) เช่นนี้พวกเขาขาดมาตรการโดยรวมที่ชัดเจนของการจัดตำแหน่งที่มีคุณภาพ เมื่อเร็ว ๆ นี้เออรเคยวิธีการได้รับการเสนอที่จะช่วยลดความต้องการการคำนวณของการเขียนโปรแกรมแบบไดนามิกนำไปใช้กับลำดับการจัดเรียงหลาย ๆ (23, 24) เราอธิบายการออกแบบและการประยุกต์ใช้เครื่องมือสำหรับลำดับการจัดเรียงหลายตัวที่ใช้วิธีการเหล่านี้
การแปล กรุณารอสักครู่..
