Annotation of any genome, but particularly plant genomes, is difficult especially as the definition of what constitutes a gene continues to evolve. Many parts of the genome are ‘expressed’ in that RNAs are formed, but do not correspond to traditional genes in that they are not translated to a protein. However, most annotated plant genomes have between 20,000 and 94,000 genes with a median predicted gene count of 32,605 (Table 1, Fig. 1C). Differences between genomes most likely lies in the tools used for annotation and how relaxed the annotators were in calling genes as well as lineage-specific genes and gene family expansions. Genomes produced by next generation sequencing typically have smaller contig and scaffold sizes that complicate annotation as genes may not exist on single contigs but may be broken across contigs, thus inflating the number of annotated genes (e.g., pigeon pea, Varshney et al., 2012). Further complicating annotation is that there are many expressed non-coding RNAs that are functionally important (Eddy, 2001), but not considered genes in a traditional sense. Small RNA precursors are often not included in a genome annotation, but are important for plant development and silencing of TEs (Arikit et al., 2013). Small RNAs and other non-coding RNAs are often annotated and curated separately from genome annotations in small, boutique databases. Long-term, however, one goal should be to combine these various sources of information into a single database/annotation making it easier for the biologist to pull together relevant information needed for forming hypotheses.
คำอธิบายของกลุ่มใด ๆ โดยเฉพาะอย่างยิ่งพืช genomes ได้ยากโดยเฉพาะอย่างยิ่งเป็นการกำหนดถึงองค์ประกอบของยีนยังคงพัฒนา หลายส่วนของกลุ่มจะ 'แสดง' ที่ RNAs จะ แต่ไม่สอดคล้องกับยีนดั้งเดิมที่พวกเขาจะไม่แปลเป็นโปรตีน อย่างไรก็ตาม สุดประกอบพืช genomes ได้ระหว่างยีน 20000 และ 94,000 มีค่ามัธยฐานการคาดการณ์จำนวนยีน 32,605 (ตารางที่ 1, Fig. 1C) ความแตกต่างระหว่าง genomes มักอยู่ในเครื่องมือที่ใช้สำหรับคำอธิบายและวิธีผ่อนคลาย annotators ที่อยู่ในการเรียกยีนเป็นยีนเฉพาะคนเชื้อสาย และขยายครอบครัวยีน Genomes ผลิต โดยรุ่นต่อไปที่จัดลำดับโดยทั่วไปมี contig ขนาดเล็กและขนาดนั่งร้านที่ complicate อธิบายยีนอาจไม่มีอยู่ใน contigs เดียว แต่อาจเสียทั้ง contigs ดังนั้น inflating จำนวนยีนประกอบ (เช่น นกพิราบถั่ว Varshney et al., 2012) Complicating คำอธิบายเพิ่มเติม ไว้ว่า มีหลายคนแสดงไม่ใช่รหัส RNAs ที่มีฟังก์ชันสำคัญ (Eddy, 2001), แต่ยีนไม่พิจารณาในความรู้สึกแบบดั้งเดิม Precursors อาร์เอ็นเอขนาดเล็กมักจะไม่รวมอยู่ในคำอธิบายของกลุ่มการ แต่มีความสำคัญต่อการพัฒนาพืช และ silencing ของทดสอบ (Arikit et al., 2013) RNAs เล็ก RNAs อื่น ๆ ไม่ใช่โค้ดมักจะใส่คำอธิบายประกอบ และ curated แยกต่างหากจากคำอธิบายของกลุ่มในฐานข้อมูลขนาดเล็ก บูติค ระยะยาว ไร เป้าหมายหนึ่งควรจะรวมแหล่งข้อมูลในที่เดียวฐานข้อมูล/คำอธิบายทำให้ง่ายสำหรับนักชีววิทยาจะดึงข้อมูลที่เกี่ยวข้องที่จำเป็นสำหรับการขึ้นรูปสมมุติฐานกันเหล่านี้ต่าง ๆ กัน
การแปล กรุณารอสักครู่..
หมายเหตุของจีโนมใด ๆ แต่โดยเฉพาะอย่างยิ่งจีโนมของพืชเป็นเรื่องยากโดยเฉพาะอย่างยิ่งความหมายของสิ่งที่ถือว่ายีนยังคงมีวิวัฒนาการ หลายส่วนของจีโนมที่มี 'แสดง' ใน RNAs ที่เกิดขึ้น แต่ไม่สอดคล้องกับยีนแบบดั้งเดิมในการที่พวกเขาไม่ได้แปลเป็นโปรตีน อย่างไรก็ตามจีโนมของพืชข้อเขียนส่วนใหญ่จะมีระหว่าง 20,000 และ 94,000 ยีนที่มีค่าเฉลี่ยคาดการณ์นับยีน 32605 (ตารางที่ 1, รูป. 1C) ความแตกต่างระหว่างจีโนมส่วนใหญ่จะอยู่ในเครื่องมือที่ใช้สำหรับบันทึกย่อและวิธีการผ่อนคลาย annotators อยู่ในการเรียกยีนเช่นเดียวกับยีนสายเลือดที่เฉพาะเจาะจงและการขยายครอบครัวของยีน จีโนมที่ผลิตโดยลำดับรุ่นต่อไปมักจะมี contig ขนาดเล็กและขนาดนั่งร้านที่ซับซ้อนคำอธิบายประกอบเป็นยีนที่อาจจะไม่อยู่ใน contigs เดียว แต่อาจจะแตกทั่ว contigs จึงพองจำนวนของยีนข้อเขียน (เช่นถั่วมะแฮะ, Varshney et al., 2012 ) ดําเนินต่อไปบันทึกย่อก็คือว่ามีจำนวนมากแสดงความ RNAs ที่ไม่ใช่การเข้ารหัสที่มีความสำคัญหน้าที่ (Eddy, 2001) แต่ไม่ได้รับการพิจารณายีนในความรู้สึกแบบดั้งเดิม สารตั้งต้น RNA ขนาดเล็กมักจะไม่รวมอยู่ในคำอธิบายประกอบจีโนม แต่มีความสำคัญสำหรับการพัฒนาอาคารและห้ามไม่ให้พูดของหลาน (Arikit et al., 2013) RNAs ขนาดเล็กและ RNAs อื่น ๆ ที่ไม่ใช่การเข้ารหัสจะข้อเขียนและมักจะ curated แยกต่างหากจากคำอธิบายประกอบในจีโนมขนาดเล็กฐานข้อมูลบูติก ระยะยาว แต่เป้าหมายหนึ่งที่ควรจะเป็นในการรวมแหล่งต่างๆเหล่านี้ของข้อมูลในฐานข้อมูลเดียว / คำอธิบายประกอบทำให้ง่ายขึ้นสำหรับนักชีววิทยาที่จะดึงข้อมูลที่เกี่ยวข้องร่วมกันที่จำเป็นสำหรับการสร้างสมมติฐาน
การแปล กรุณารอสักครู่..
หมายเหตุใด ๆ ( แต่หายาก โดยเฉพาะอย่างยิ่ง โดยเฉพาะอย่างยิ่งพืช , เป็นนิยามของสิ่งที่ถือว่าเป็นยีนที่ยังคงมีวิวัฒนาการ หลายส่วนของโครโมโซมจะ ' แสดง ' ใน RNAs จะเกิดขึ้น แต่ไม่สอดคล้องกับยีนดั้งเดิมในการที่พวกเขาจะไม่แปลให้โปรตีน อย่างไรก็ตาม ส่วนใหญ่แสดงโรงงาน Genomes ได้ระหว่าง 20 , 000 และ 94000 ยีนด้วยยีนโดยคาดการณ์นับ 32605 ( ตารางที่ 1 ภาพที่ 1c ) ความแตกต่างระหว่างจีโนมส่วนใหญ่อยู่ในเครื่องมือที่ใช้สำหรับการจัดการและวิธีผ่อนคลาย annotators อยู่เรียกยีนเป็นยีนที่เฉพาะเจาะจงและขยายครอบครัวเชื้อสายจีนหาที่ผลิตโดยลำดับรุ่นถัดไปมักจะมีขนาดเล็กและขนาด contig นั่งร้านหมายเหตุที่ซับซ้อนเป็นยีนอาจอยู่ในตัวเดียว แต่อาจจะเสียทั้งสูงสูง จึงทำให้จำนวนของบันทึกย่อยีน ( เช่น ถั่วมะแฮะ varshney , et al . , 2012 )หมายเหตุเพิ่มเติมแทรกซ้อนคือมีหลายแสดงรหัส RNAs ที่มีหน้าที่สำคัญไม่ ( Eddy , 2001 ) แต่ไม่ถือว่าเป็นยีนในความรู้สึกแบบดั้งเดิม สารตั้งต้น RNA ขนาดเล็กมักจะไม่รวมอยู่ในจีโนมหมายเหตุ แต่สำคัญสำหรับการพัฒนาพืชและความเงียบของ TES ( arikit et al . , 2013 )RNAs ขนาดเล็กและไม่อื่น ๆรหัส RNAs มักจะแสดง curated และแยกต่างหากจากจีโนมอื่นในฐานข้อมูลบูติกขนาดเล็ก ระยะยาว อย่างไรก็ตาม เป้าหมายหนึ่งควรที่จะรวมแหล่งข้อมูลต่าง ๆเหล่านี้ของข้อมูลในฐานข้อมูลเดียว / หมายเหตุง่ายสำหรับนักชีววิทยาเพื่อดึงข้อมูลที่เกี่ยวข้องที่จำเป็นสำหรับสร้างสมมติฐาน
การแปล กรุณารอสักครู่..