JASPAR profile collection [15]. Alignment submission accepts the de facto standard CLUSTALW format [25]. In all operating modes, users are allowed to submit a cDNA sequence to define exon locations. Users may also submit new matrix profiles of their own construction.
Results can be obtained in three distinct report formats. Graphical view (Figure 3a) displays an alignment overview and conservation plots with x-axis reference for each submitted sequence. Positions of conserved TFBSs are indicated above the plot. The transcription-factor labels are equipped with mouse-over function to display additional data (the name and structural class of the factor, and the absolute and relative site scores), and are hyperlinked to further information on the TF and its binding profile (Figure 3b). The popup windows provide data summaries, including a sequence logo (graphical representation of the specificity of the profile based on position-specific information content [26]) with the corresponding profile from the database. Alignment view (Figure 3c) provides a detailed overview of the detected potential TFBSs displayed on the sequence. The numbering indicates positions in the actual sequences, and the predicted TFBSs are marked. For convenience, a tabular output of detected sites with associated details is also provided in Table view.
Discussion
Comparison of orthologous genomic sequences is an effective method for the identification of segments likely to mediate a sequence-specific biological function. The performance of phylogenetic footprinting methods for the detection of TFBSs is dependent upon multiple factors, including the alignment algorithm, the available binding profiles and the evolutionary distance between the target sequences. Two key data resources are introduced in this study: a novel collection of transcription-factor binding profiles compiled from the biological research literature and a reference test set for phylogenetic footprinting methods. The ConSite web interface to the system facilitates user control, an essential feature for users studying diverse genomes.
The binding profile collection is an important resource for bioinformatics projects. Like the TFBS programming system [27], the JASPAR profile collection is available freely to the research community [15]. The profiles are non-redundant and are restricted to those cases for which sufficient binding data were available to generate a meaningful representation of the binding
specificity of a TF. Continuing expansion of the collection is anticipated, given the strong research progress in modeling DNA binding sites [28].
The new phylogenetic footprinting reference collection of TFBSs allows for quantitative assessment of the performance of new methods. This is the largest collection of its kind available for
broad use. In our study, we could detect around 68% of the experimentally defined TFBSs in conserved segments (at 65% relative matrix score threshold; see Figure 2). This differs slightly from the outcome of a study of conservation
properties proximal to TFBSs [29], which indicated that only around 50% of sites are situated in conserved regions. There are several key factors that may account for this difference. The procedures for defining the collections were different. For
instance, the amount of flanking sequence used for mapping the locations of the sites onto genome sequences was lower in the previous study. These short fragments were mapped onto a commercial human genome assembly and the mapped regions compared to shotgun-generated fragments of mouse genomes from multiple strains. The alignment procedures were also different, with the older set aligned by BLAST [30] and assessed
non-trivial task. Such a system must allow for weighting based on evolutionary distances to preserve sensitivity, and requires advances in multiple sequence alignment algorithms. Some steps in this direction are beginning to emerge [31,32].
No single resource offers the same set of functions or integration as ConSite. The only similarly scoped resource is the recently published rVista [33], which searches for TFBSs in a reference sequence and filters the results for sites in regions of high conservation with respect to a second genomic sequence. Unlike rVista, ConSite searches both sequences for TFBSs, for better specificity, and enables easy modification of the parameters for interactive analysis, as well as providing different output formats
to aid the design and interpretation of experiments in molecular biotechnology. ConSite’s publicly available collection of transcriptionfactor profiles allows users to access information about the TFs associated with the predicted sites. Given that many users focus on a specific TF and have developed highquality models of their own, ConSite also allows for userdefined profiles
JASPAR โพรไฟล์ชุด [15] จัดส่งยอมรับเดิมมาตรฐาน CLUSTALW รูปแบบ [25] ในโหมดการทำงานทั้งหมด ผู้ได้รับอนุญาตให้ถือลำดับ cDNA เพื่อกำหนดตำแหน่ง exon ผู้ใช้อาจยังส่งค่าเมตริกซ์ใหม่ของตนเองได้ผลลัพธ์ในรูปแบบรายงานทั้งสาม ดูรูปภาพ (รูปที่ 3a) แสดงภาพการจัดตำแหน่ง และอนุรักษ์ผืนกับแกนอ้างอิงสำหรับแต่ละลำดับส่ง ตำแหน่งของ TFBSs นำจะแสดงด้านบนพล็อต ป้าย transcription ปัจจัยเพียบพร้อมไป ด้วยฟังก์ชันมากกว่าเมาส์เพื่อแสดงข้อมูลเพิ่มเติม (ชื่อและระดับโครงสร้างของตัว และคะแนนแบบสัมบูรณ์ และสัมพัทธ์ไซต์), และมีการเชื่อมโยงหลายมิติให้ข้อมูลเพิ่มเติมเกี่ยวกับรหัสและโปรไฟล์ของผูก (รูปที่ 3b) หน้าต่างแบบผุดขึ้นให้สรุปข้อมูล รวมถึงโลโก้ลำดับ (ภาพของ specificity โพรไฟล์ตามเนื้อหาข้อมูลตำแหน่งเฉพาะ [26]) กับส่วนกำหนดค่าที่เกี่ยวข้องจากฐานข้อมูล ดูตำแหน่ง (รูปที่ 3 c) แสดงภาพรวมโดยละเอียดของ TFBSs อาจพบปรากฏในลำดับที่ กำหนดหมายเลขระบุตำแหน่งในลำดับจริง และทำเครื่องหมาย TFBSs คาดการณ์ ยังให้บริการออกแบบตารางของอเมริกาที่ตรวจพบมีรายละเอียดที่เกี่ยวข้องเพื่อความสะดวก ในมุมมองตาราง สนทนาเปรียบเทียบลำดับ genomic orthologous เป็นวิธีมีประสิทธิภาพสำหรับการระบุแนวโน้มที่จะบรรเทาฟังก์ชันชีวภาพลำดับเฉพาะเซ็กเมนต์ ประสิทธิภาพของวิธีการตรวจพบ TFBSs phylogenetic footprinting หลายปัจจัย อัลกอริทึมการจัดตำแหน่ง โปรไฟล์รวมว่าง และระยะห่างระหว่างลำดับเป้าหมายวิวัฒนาการขึ้นได้ สองคีย์ข้อมูลทรัพยากรจะนำมาใช้ในการศึกษานี้: ชุดนวนิยายของ transcription ปัจจัยรวมประวัติรวบรวมจากเอกสารประกอบการวิจัยชีวภาพและทดสอบการอ้างอิงการตั้งค่าสำหรับวิธี phylogenetic footprinting ConSite เว็บอินเทอร์เฟซระบบอำนวยความสะดวกให้ผู้ใช้ควบคุม คุณลักษณะจำเป็นสำหรับผู้เรียนหลากหลาย genomes เรียกเก็บเงินค่าผูกเป็นทรัพยากรสำคัญสำหรับโครงการ bioinformatics เก็บโปรไฟล์ JASPAR จะไม่พร้อมใช้งานได้อย่างอิสระเพื่อชุมชนวิจัย [15] เช่น TFBS เขียนโปรแกรมระบบ [27], โพรไฟล์จะไม่ซ้ำซ้อน และมีจำกัดกรณีผูกข้อมูลเพียงพอจะสร้างตัวแทนความหมายของการรวม specificity ของรหัสการ ต่อการขยายตัวของคอลเลกชันคาด รับวิจัยที่แข็งแกร่งความคืบหน้าในไซต์รวมดีเอ็นเอ [28]เก็บการอ้างอิง phylogenetic footprinting ใหม่ของ TFBSs สำหรับการประเมินประสิทธิภาพของวิธีการใหม่เชิงปริมาณได้ นี่คือคอลเลกชันที่ใหญ่ที่สุดของชนิดสำหรับ กว้างใช้ ในการศึกษาของเรา เราสามารถตรวจพบประมาณ 68% ของ TFBSs experimentally กำหนดไว้ในส่วนนำ (ที่ขีดจำกัดเมตริกซ์สัมพัทธ์ 65% คะแนน ดูรูปที่ 2) นี้แตกต่างเล็กน้อยจากผลการศึกษาการอนุรักษ์proximal เพื่อ TFBSs [29], ซึ่งระบุว่า เพียงประมาณ 50% ของอเมริกาอยู่ใน คุณสมบัติอยู่ภูมิภาค มีปัจจัยสำคัญหลายที่สามารถบัญชีสำหรับความแตกต่างนี้ ขั้นตอนการกำหนดคอลเลกชันแตกต่างกัน สำหรับ อินสแตนซ์ จำนวน flanking ลำดับที่ใช้สำหรับการแม็ปตำแหน่งของไซต์ไปยังกลุ่มลำดับต่ำกว่าในการศึกษาก่อนหน้านี้ การกระจายตัวย่อเหล่านี้ถูกแมปประกอบพาณิชย์มมนุษย์และภูมิภาคแมปเมื่อเทียบกับปืนสร้างชิ้นส่วนของเมาส์ genomes จากหลายสายพันธุ์ ขั้นตอนการจัดตำแหน่งยังแตกต่างกัน มีชุดเก่าที่จัดด้วย [30] และประเมิน งานเล็กไม่น้อย ระบบดังกล่าวต้องให้สำหรับน้ำหนักตามระยะทางวิวัฒนาการการรักษาไว และต้องการความก้าวหน้าในตำแหน่งหลายลำดับในอัลกอริทึม บางขั้นตอนในทิศทางนี้จะเริ่มโผล่ [31,32]ทรัพยากรไม่มีชุดเดียวกันของฟังก์ชันหรือการรวมเป็น ConSite ทรัพยากร scoped ทำนองเดียว rVista ประกาศเมื่อเร็ว ๆ นี้ [33], ซึ่งหา TFBSs อ้างอิงตามลำดับ และกรองผลลัพธ์ท่องเที่ยวในภูมิภาคการอนุรักษ์สูงกับ genomic ลำดับสอง ได้ ซึ่งแตกต่างจาก rVista, ConSite หาลำดับทั้งสองสำหรับ TFBSs, specificity ดี และเปิดใช้งานง่ายปรับเปลี่ยนพารามิเตอร์สำหรับการวิเคราะห์แบบโต้ตอบ รวมถึงรูปแบบผลลัพธ์ที่แตกต่างกัน เพื่อช่วยการออกแบบและการตีความการทดลองในด้านเทคโนโลยีชีวภาพระดับโมเลกุล ชุดของ ConSite เผย transcriptionfactor โพรไฟล์ผู้ใช้เข้าถึงข้อมูลเกี่ยวกับ TFs ที่สัมพันธ์กับไซต์คาดการณ์ได้ ระบุว่าผู้ใช้จำนวนมากเน้นรหัสเฉพาะ และมีพัฒนารูปแบบกำกับของตนเอง ConSite ยังอนุญาตให้สำหรับโพรไฟล์ userdefined
การแปล กรุณารอสักครู่..