GenomeScan is a program for identifying the exon-intron
structures of genes in genomic DNA sequences from a variety of
organisms, with a focus on human and other vertebrates. The algorithm
combines two principal sources of information: 1) models of
exon-intron and splice signal composition; and 2) sequence similarity
information such as BLASTX hits. The input to the program consists of
a genomic sequence previously masked with RepeatMasker, a parameter
file for the appropriate organism and a 'Genoa file' containing a
summary of available sequence similarity information. The program
determines the most likely "parse" (gene structure) conditional on the
given similarity information under a probabilistic model of the gene
structural and compositional properties of genomic DNA for the given
organism. The locations of all predicted exons and genes are printed
to an output file (the text output) together with the corresponding
predicted CDS (coding DNA) and peptide sequences and a summary of the
similarity information used in the predictions. A graphical
(PostScript) output is also created displaying the location of each
predicted exon and of each BLASTX hit. Like Genscan, the model treats
the general case in which the sequence may contain no genes, one gene,
or multiple genes on either or both DNA strands, and partial genes as
well as complete genes are considered. The most important
restrictions are that only protein coding genes are considered (and
not tRNA or rRNA genes, for example), that transcription units are
assumed to be non-overlapping, and that all predicted genes must have
at least modest similarity to a known protein.
genomescan เป็นโปรแกรมสำหรับการระบุชนิดโครงสร้างของยีนในจีโนม iNtRON
ลำดับ DNA จากความหลากหลายของสิ่งมีชีวิต โดยมุ่งเน้นในมนุษย์และสัตว์อื่น ๆ ขั้นตอนวิธี
รวมสองแหล่งหลักของข้อมูล : 1 ) รูปแบบของชนิดและองค์ประกอบ
iNtRON สัญญาณประกบกัน และ 2 ) ลำดับความเหมือน
ข้อมูลเช่น blastx ฮิต การป้อนข้อมูลไปยังโปรแกรมประกอบด้วย
ลำดับจีโนมก่อนหน้านี้สวมหน้ากากกับ repeatmasker , พารามิเตอร์
ไฟล์สำหรับสิ่งมีชีวิตที่เหมาะสมและไฟล์ ' เจนัว ' ที่มีความเหมือนลำดับ
สรุปข้อมูลที่มีอยู่ โปรแกรม
กําหนดมากที่สุด " แยก " ( โครงสร้างของยีน ) เงื่อนไข
ให้ข้อมูลความเหมือนภายใต้รูปแบบความน่าจะเป็นของยีน
โครงสร้างและส่วนประกอบ คุณสมบัติของ genomic DNA เพื่อให้
สิ่งมีชีวิต . ตำแหน่งของโคยีนทำนายและพิมพ์
ให้ output ไฟล์ ( ข้อความออก ) พร้อมกับสอดคล้อง
ทำนายซีดี ( รหัสดีเอ็นเอและลำดับเปปไทด์และบทสรุปของ
ความเหมือนข้อมูลใช้ในการคาดการณ์ .
กราฟิก( ป.ล. ) ผลผลิตยังสร้าง แสดงที่ตั้งของแต่ละชนิดของแต่ละ blastx
ทำนายและตี ชอบ genscan , รูปแบบถือว่า
กรณีทั่วไปซึ่งในลำดับอาจไม่มียีน , ยีน , ยีนบน
หรือหลายอย่างใดอย่างหนึ่งหรือทั้งสองเส้นดีเอ็นเอและยีนดียีนบางส่วนเป็น
สมบูรณ์จะถือว่า ที่สำคัญที่สุด
ข้อ จำกัด ที่ถือว่าเป็นโปรตีนเพียงการเข้ารหัสยีน (
ไม่ใช่การเมารถหรือ rRNA ยีน , ตัวอย่างเช่น ) , หน่วยงานที่ transcription จะ
ถือว่ามีไม่ทับซ้อนกัน และการที่คาดการณ์ยีนต้อง
อย่างน้อยเจียมเนื้อเจียมตัวรู้จักความเหมือนกับโปรตีน
การแปล กรุณารอสักครู่..
