Comparative analysis of DNA and amino acid sequences is an increasingly important component of biological research. Sequence alignment, in particular, has been helpful in the study of molecular evolution (1), RNA folding (2), gene regulation (3), and protein structure-function relationships (4). Although pairwise sequence comparisons have proven useful, for example, in data base searches (5, 6), some biologically significant similarities may only be detected by aligning a set ofsequences (7, 8). Likewise, patterns or motifs common to a set offunctionally related proteins may only be apparent from analysis of a multiple alignment of these sequences (9). To align a pair of sequences, one must have a notion of what makes one possible alignment better than another: a measure of the quality of an alignment. Although there are many programs available for pairwise sequence alignment, the most widely accepted tools use variations ofthe dynamic programming method (10-13). These methods use an explicit measure of alignment quality, consisting ofdefined costs for aligned pairs of residues, or residues with gaps, and use an algorithm for finding an alignment with minimum total cost. Extending these methods to multiple sequences poses a number of problems, among which are how to measure the cost of a multiple alignment and how to choose gap costs consistent with the measure chosen (14). The biggest obstacle to using dynamic programming for multiple sequence alignment, however, has been the com- putational requirements of the method; those tools that do use dynamic programming have been limited to aligning no more than three sequences (15, 16). Given these difficulties, most alternative multiple alignment programs use heuristics or minimize alignment costs that are not clearly tied to models ofmolecular evolution (17-22). As such, they lack an explicit overall measure ofalignment quality. Recently, how- ever, methods have been proposed to greatly reduce the computational demands of dynamic programming applied to multiple sequence alignment (23, 24). We describe the design and application ofa tool for multiple sequence alignment that implements these methods.
วิเคราะห์เปรียบเทียบลำดับดีเอ็นเอและกรดอะมิโนเป็นส่วนประกอบสำคัญมากของการวิจัยทางชีวภาพ ลำดับตำแหน่ง โดยเฉพาะ ได้ประโยชน์ในการศึกษาวิวัฒนาการระดับโมเลกุล (1), อาร์เอ็นเอพับ (2), ยีนควบคุม (3), และโปรตีนโครงสร้างฟังก์ชันความสัมพันธ์ (4) แม้ว่าการเปรียบเทียบลำดับแพร์ไวส์ได้พิสูจน์ให้เป็นประโยชน์ ตัวอย่าง ข้อมูลค้นหาพื้นฐาน (5, 6), ความคล้ายคลึงบางชิ้นสำคัญอาจเพียงพบโดย ofsequences ชุด (7, 8) ทำนองเดียวกัน รูปแบบหรือลงไป offunctionally การตั้งค่าที่เกี่ยวข้องกับโปรตีนเท่านั้นอาจเห็นได้ชัดเจนจากการวิเคราะห์ตำแหน่งหลายลำดับเหล่านี้ (9) ตำแหน่งคู่ลำดับ หนึ่งต้องมีแนวคิดของสิ่งที่ทำให้ได้ตำแหน่งหนึ่งที่ดีกว่าอีก: การวัดคุณภาพของการจัดตำแหน่ง แม้ว่ามีหลายโปรแกรมสำหรับการจัดตำแหน่งลำดับแพร์ไวส์ มากสุดอย่างกว้างขวางยอมรับเครื่องมือที่ใช้รูปแบบวิธีการเขียนโปรแกรมแบบไดนามิก (10-13) วิธีการเหล่านี้ใช้วัดตำแหน่งคุณภาพ ประกอบด้วย ofdefined จัดตำแหน่งคู่ตกค้าง หรือตก ด้วยช่องว่าง ต้นทุนที่ชัดเจน และใช้อัลกอริทึมการหาความสอดคล้องกับต้นทุนรวมต่ำสุด ขยายลำดับหลายวิธีเหล่านี้ส่อเค้าปัญหา ผู้ซึ่งมีวิธีการวัดต้นทุนของการจัดตำแหน่งหลายและวิธีการเลือกช่องว่างของต้นทุนสอดคล้องกับการวัดที่เลือก (14) อุปสรรคสำคัญสำหรับการใช้ไดนามิกสำหรับหลายลำดับตำแหน่ง การเขียนโปรแกรมอย่างไรก็ตาม ได้รับ com - putational ความต้องการของวิธี บรรดาเครื่องมือที่ใช้ในการเขียนโปรแกรมแบบมีจำกัดให้จัดเรียงลำดับไม่เกิน 3 (15, 16) ให้ยากลำบากเหล่านี้ ทางเลือกสุดหลายตำแหน่งโปรแกรมใช้การลองผิดลองถูก หรือลดต้นทุนการจัดตำแหน่งที่ชัดเจนไม่เกี่ยวพันกับรุ่น ofmolecular วิวัฒนาการ (17-22) เช่น พวกเขายังขาดคุณภาพ ofalignment วัดชัดเจนโดยรวมการ ล่าสุด วิธี - เคย วิธีได้รับการเสนอเพื่อลดการคำนวณความต้องการของการเขียนโปรแกรมแบบไดนามิกกับตำแหน่งลำดับหลาย (23, 24) มาก เราอธิบายเครื่องมือเสิร์ฟออกแบบและการประยุกต์สำหรับการจัดลำดับหลายตำแหน่งที่วิธีการเหล่านี้
การแปล กรุณารอสักครู่..
การวิเคราะห์เปรียบเทียบดีเอ็นเอและลำดับกรดอะมิโนเป็นองค์ประกอบที่สำคัญมากขึ้นของการวิจัยทางชีววิทยา การจัดเรียงลำดับโดยเฉพาะอย่างยิ่งได้รับประโยชน์ในการศึกษาวิวัฒนาการของโมเลกุล (1), RNA พับ (2), การควบคุมยีน (3) และความสัมพันธ์โปรตีนโครงสร้างและหน้าที่ (4) แม้ว่าการเปรียบเทียบลำดับคู่ได้พิสูจน์แล้วว่ามีประโยชน์เช่นในการค้นหาฐานข้อมูล (5, 6) บางส่วนคล้ายคลึงกันอย่างมีนัยสำคัญทางชีวภาพอาจจะถูกตรวจพบโดยจัดชุด ofsequences (7, 8) ในทำนองเดียวกันรูปแบบหรือลวดลายธรรมดาที่จะตั้งโปรตีนที่เกี่ยวข้อง offunctionally อาจจะเป็นแค่ที่เห็นได้ชัดจากการวิเคราะห์ของการจัดตำแหน่งหลายลำดับเหล่านี้ (9) เพื่อให้สอดคล้องคู่ของลำดับหนึ่งต้องมีความคิดของสิ่งที่ทำให้การจัดตำแหน่งหนึ่งที่เป็นไปได้ดีกว่าอีก: ตัวชี้วัดคุณภาพของการจัดตำแหน่ง แม้ว่าจะมีหลายโปรแกรมพร้อมใช้งานสำหรับลำดับการจัดเรียงคู่, เครื่องมือที่ได้รับการยอมรับอย่างกว้างขวางใช้รูปแบบ ofthe วิธีการเขียนโปรแกรมแบบไดนามิก (10-13) วิธีการเหล่านี้ใช้ตัวชี้วัดที่ชัดเจนของการจัดตำแหน่งที่มีคุณภาพซึ่งประกอบด้วยค่าใช้จ่าย ofdefined สำหรับคู่ของสารตกค้างชิดหรือสารตกค้างที่มีช่องว่างและใช้อัลกอริทึมสำหรับการค้นหาสอดคล้องกับค่าใช้จ่ายรวมต่ำสุด ขยายวิธีการเหล่านี้จะวนเวียนอยู่หลาย poses จำนวนของปัญหาในระหว่างที่มีวิธีการวัดค่าใช้จ่ายในการจัดตำแหน่งหลายและวิธีการเลือกช่องว่างค่าใช้จ่ายที่สอดคล้องกับตัวชี้วัดที่เลือก (14) อุปสรรคที่ใหญ่ที่สุดในการใช้การเขียนโปรแกรมแบบไดนามิกสำหรับลำดับการจัดเรียงหลาย แต่ได้รับความต้องการ putational สมบูรณ์ของวิธีการ; เครื่องมือที่จะใช้ในการเขียนโปรแกรมแบบไดนามิกได้รับการ จำกัด ในการจัดตำแหน่งไม่เกินสามลำดับ (15, 16) ที่ได้รับความยากลำบากเหล่านี้ทางเลือกที่มากที่สุดโปรแกรมการจัดตำแหน่งหลายใช้วิเคราะห์พฤติกรรมหรือลดค่าใช้จ่ายในการจัดตำแหน่งที่ไม่ได้เชื่อมโยงอย่างชัดเจนกับรุ่น ofmolecular วิวัฒนาการ (17-22) เช่นนี้พวกเขาขาดมาตรการโดยรวมอย่างชัดเจนที่มีคุณภาพ ofalignment เมื่อเร็ว ๆ นี้เออรเคยวิธีการได้รับการเสนอที่จะช่วยลดความต้องการการคำนวณของการเขียนโปรแกรมแบบไดนามิกนำไปใช้กับลำดับการจัดเรียงหลาย ๆ (23, 24) เราอธิบายการออกแบบและการประยุกต์ใช้เครื่องมือ OFA สำหรับลำดับการจัดเรียงหลายตัวที่ใช้วิธีการเหล่านี้
การแปล กรุณารอสักครู่..