Plant genomes are packed, and often obese, with transposable elements (TEs) (Bennetzen 2000), which contain protein-coding sequences that are often annotated as genes. In rice, for instance, it was estimated that only 40,000 of the more than 55,000 annotated genes are really genes and that the other 10,000 to 15,000 are TEs–usually low copy TEs as high copy elements are relatively easy to find (Bennetzen et al., 2004). TEs include various families that move via copy-and-paste (class I) and cut-and-paste (class II) mechanisms. Copy-and-paste TEs can dramatically increase the size of a genome such as occurred in a relative of rice with a genome nearly two-fold larger than rice (Piegu et al., 2006). Transposon biology is an intriguing area of research and relies on relatively complete genomes so that TEs are captured in sequence contigs and can be accurately annotated. Schemes for classification of TEs have been agreed on (Wicker et al., 2007), but annotation of non-LTR TEs is complicated by the lack of structural clues that allow routine ab initio prediction (El Baidouri and Panaud, 2013). Another complication is that in genomes produced by short read DNA sequencing technology, TEs are often missed in the assembly due to their repetitive nature. Genomes sequenced to date range from 3 to 85% repetitive sequence (Table 1; median 43%), with TEs, specifically cut-and-paste TEs (LTRs), comprising the majority of that sequence. Capturing and annotating these genomic components is important as it is becoming increasingly clear that TEs can be domesticated to function in gene regulation and as structural components of the genome.
พืช genomes ได้รวบรวม และมักจะ อ้วน กับ transposable องค์ประกอบ (ทดสอบ) (Bennetzen 2000), ซึ่งประกอบด้วยลำดับรหัสโปรตีนที่มักจะใส่คำอธิบายประกอบเป็นยีน ข้าว เช่น มันได้ประมาณ 40000 ของยีนประกอบมากกว่า 55000 จริง ๆ ยีน และอื่น ๆ 100000 ถึงทดสอบซึ่งโดยปกติสำเนาต่ำทดสอบเป็นองค์ประกอบสูงสำเนาค่อนข้างง่ายในการค้นหา (Bennetzen et al., 2004) ทดสอบรวมครอบครัวต่าง ๆ ที่เคลื่อนย้ายผ่านคัดลอก และวาง (คลาฉัน) และกลไกการตัด และวาง (ชั้นสอง) ทดสอบการคัดลอก และวางอย่างมากขึ้นของจีโนมเป็นเช่นเกิดในญาติของข้าวกลุ่มเกือบสองพับมากกว่าข้าว (Piegu และ al., 2006) Transposon ชีววิทยาวิจัยพื้นที่น่า และอาศัย genomes ค่อนข้างสมบูรณ์ที่ถูกจับในลำดับ contigs ทดสอบ และสามารถจะสามารถใส่คำอธิบายประกอบ แผนงานการจัดทดสอบการตกลงบน (หวาย et al., 2007), แต่คำอธิบายของไม่ - LTR ทดสอบจะมีความซับซ้อน โดยการขาดโครงสร้างปมที่ทำให้ประจำ ab initio ทำนาย (El Baidouri และ Panaud, 2013) ภาวะแทรกซ้อนอื่นคือ ว่า ใน genomes ผลิต โดยลำดับดีเอ็นเอสั้น ๆ อ่านเทคโนโลยี ทดสอบมักจะพลาดในแอสเซมบลีเนื่องจากธรรมชาติของพวกเขาซ้ำ Genomes เรียงลำดับช่วงวันที่ 3 ไป 85% ซ้ำลำดับ (ตารางที่ 1 เดียน 43%), ทดสอบ โดยเฉพาะตัด และวางทดสอบ (LTRs), ลำดับที่ส่วนใหญ่ประกอบด้วย การรวบรวม และทำหมายเหตุในส่วนประกอบของ genomic เหล่านี้เป็นสิ่งสำคัญที่จะกลายเป็นชัดเจนมากขึ้นว่า สามารถ domesticated ทดสอบฟังก์ชันการควบคุมยีน และ เป็นส่วนประกอบของโครงสร้างของกลุ่ม
การแปล กรุณารอสักครู่..
จีโนมของพืชจะบรรจุและโรคอ้วนมักจะมีองค์ประกอบ transposable (หลาน) (Bennetzen 2000) ซึ่งมีลำดับโปรตีนการเข้ารหัสที่มีข้อเขียนมักจะเป็นยีน ในข้าวเช่นมันเป็นที่คาดกันว่ามีเพียง 40,000 กว่า 55,000 ยีนข้อเขียนจริงๆยีนและที่อื่น ๆ 10,000 ถึง 15,000 เป็นหลานมักจะหลานสำเนาต่ำเป็นองค์ประกอบสำเนาสูงค่อนข้างที่จะหาง่าย (Bennetzen et al, , 2004) หลานรวมถึงครอบครัวต่างๆที่ย้ายผ่านการคัดลอกและวาง (ระดับ I) และตัดและวาง (ชั้นสอง) กลไก หลานคัดลอกและวางอย่างมากสามารถเพิ่มขนาดของจีโนมเช่นที่เกิดขึ้นในญาติของข้าวกับจีโนมเกือบสองเท่าขนาดใหญ่กว่าข้าว (Piegu et al., 2006) ชีววิทยา transposon เป็นพื้นที่ที่น่าสนใจของการวิจัยและอาศัยอยู่กับจีโนมที่ค่อนข้างสมบูรณ์เพื่อให้หลานได้รับการบันทึกใน contigs ลำดับและสามารถบันทึกย่อได้อย่างถูกต้อง รูปแบบการจัดหมวดหมู่ของหลานได้รับการเห็นด้วยกับ (หวาย et al., 2007) แต่บันทึกย่อของหลานที่ไม่ LTR มีความซับซ้อนโดยขาดเบาะแสโครงสร้างที่ช่วยให้การคาดการณ์ประจำ AB เริ่มแรก (El BAIDOURI และ Panaud 2013) ภาวะแทรกซ้อนก็คือว่าในจีโนมที่ผลิตโดยดีเอ็นเออ่านสั้นเทคโนโลยีลำดับหลานมักจะพลาดในการชุมนุมเนื่องจากลักษณะซ้ำ ๆ ของพวกเขา จีโนมติดใจในช่วงวันที่ 3-85% ตามลำดับซ้ำ (ตารางที่ 1 ค่าเฉลี่ย 43%) กับหลานโดยเฉพาะการตัดและวางหลาน (LTRs) ประกอบด้วยส่วนใหญ่ของลำดับว่า การจับและจีโนม annotating ส่วนประกอบเหล่านี้เป็นสิ่งสำคัญที่จะกลายเป็นที่ชัดเจนมากขึ้นว่าหลานสามารถโดดเด่นในการทำงานในการควบคุมของยีนและเป็นส่วนประกอบของโครงสร้างของจีโนม
การแปล กรุณารอสักครู่..
จีโนมพืช บรรจุ และมักจะอ้วนด้วยองค์ประกอบที่ตรวจ ( ภาษาอังกฤษ ) ( bennetzen 2000 ) ซึ่งประกอบด้วยรหัสลำดับที่มักจะแสดงเป็นยีนของโปรตีน ในข้าว เช่น มันคือประมาณว่าแค่ 40000 ของมากกว่า 55 , 000 แสดงยีนยีนและอีก 10 15000 เป็นภาษาอังกฤษ– TES คัดลอกต่ำมักจะเป็นองค์ประกอบสําเนาสูงจะค่อนข้างง่ายในการค้นหา ( bennetzen et al . , 2004 ) เทส ได้แก่ครอบครัวที่ย้ายผ่านทางคัดลอกและวาง ( Class I ) และตัดแปะ ( ชั้น 2 ) กลไก คัดลอกและวางเทส สามารถเพิ่มขนาดของจีโนม เช่นที่เกิดขึ้นในความสัมพันธ์ของจีโนมข้าวที่มีเกือบสองเท่ามากกว่าข้าว ( piegu et al . , 2006 )ชีววิทยา ? ? ? ? ? คือ พื้นที่ที่น่าสนใจของการวิจัย และต้องอาศัยหาค่อนข้างสมบูรณ์เพื่อเทส ถูกจับในลำดับสูงและสามารถได้อย่างถูกต้องบันทึกย่อ . ระบบการจำแนกของเทส ที่ได้ตกลงกัน ( หวาย et al . , 2007 ) , แต่ไม่บันทึกย่อของ LTR เทสมีความซับซ้อนโดยขาดข้อมูลเชิงโครงสร้างที่ช่วยให้ขั้นตอน Ab initio พยากรณ์ ( El baidouri และ panaud 2013 )ภาวะแทรกซ้อนอื่นอยู่ในจีโนมที่ผลิตโดยสั้นอ่านดีเอ็นเอเทคโนโลยี เทส มักจะพลาดในการชุมนุมเนื่องจากธรรมชาติซ้ำของพวกเขา หาลำดับเบสในช่วงวันที่ 3 ถึง 85% ซ้ำลำดับ ( ตารางที่ 1 ; เฉลี่ย 43% ) กับ TES โดยเฉพาะตัดและวางเทส ( ltrs ) , ประกอบด้วยส่วนใหญ่ของลําดับที่จับและ annotating ส่วนประกอบจีโนมเหล่านี้เป็นสิ่งสำคัญเพราะจะกลายเป็นชัดเจนมากขึ้นว่าเทสสามารถโดดเด่นฟังก์ชั่นการควบคุมยีนและเป็นส่วนประกอบของโครงสร้างของจีโนม .
การแปล กรุณารอสักครู่..