Genome Quality Evaluation
First reads of small-insert libraries (250, 500, 800 bp) were mapped to the
assembled genome to evaluate the quality of the assembly. ‘‘PE mapped’’
represents reads being mapped to the genome as read pairs, ‘‘SE map-ped’’ represents reads being mapped to the genome as single reads,
and ‘‘uniq Mapped’’ represents reads being mapped to the genome in a
unique region. The mapped ratio of small-insert size data is more than
94%, indicating that most of theDendrobium officinalegenome has
been assembled (Supplemental Table 4). We also used Illumina short
reads to the PacBio reads before and after LSC correction with BWA-MEM(version 0.7.10-r789), setting theparameter to represent reads being
mapped to the genome as readpairs (Supplemental Table 5). Themapped
ratio is lower than the Illumina data, and the reason may be that thePacBio
reads are longer and contain more errors than the Illumina reads.
We also usedCEGMA to evaluate the assembly quality. We compared the
Dendrobiumgenome sequence against a set of core eukaryotic genes us-ing CEGMA (http://korflab.ucdavis.edu/Datasets/cegma/) and found that
227 (91.5%) were represented (Supplemental Table 6). The completeness
of theDendrobiumgenome is lower than foxtail millet (Setaria italica)
(99.19%), which may be due to the high repeat content, which resulted
in less complete assembly of D. officinalethan that of foxtail millet.
Third, we assessed the proportion of gene-sized scaffolds. The proportion
of gene-sized scaffolds occupying the total genome size can help
describe the reliability of an assembly for gene finding purposes. Using
the Ensembl 77 Genes data set, we extracted the latest protein-coding
annotations forOryza sativa,Brachypodium distachyon,Sorghum bicolor,
Musa acuminata, Elaeis guineensis, Vitis vinifera, Populus trichocarpa,
การประเมินคุณภาพของกลุ่มอ่านแรกของไลบรารีขนาดเล็กแทรก (250, 500, 800 bp) ถูกแมปไปจีโนมที่ประกอบเพื่อประเมินคุณภาพของแอสเซมบลี ''แมป PE''อ่านแทนการแมปไปยังจีโนเป็นคู่อ่าน, '' SE แผนที่เป็ด '' แทนถูกแมปไปยังจีโนเป็นเดียวอ่าน อ่านและ '' Mapped ซึ่ง '' แทนอ่านถูกแมปกับกลุ่มในการภูมิภาคที่ไม่ซ้ำกัน อัตราส่วนแมปข้อมูลขนาดเล็กแทรกอยู่มากกว่าระบุว่า ส่วนใหญ่ของ theDendrobium officinalegenome ได้ 94%การประกอบ (4 ตารางเพิ่มเติม) นอกจากนี้เรายังใช้ Illumina สั้นอ่านการ PacBio การอ่านก่อน และหลังจาก LSC แก้ไขกับ BWA MEM(version 0.7.10-r789), theparameter เพื่อแทนที่การตั้งค่าการอ่านแมปไปยังจีโนเป็น readpairs (เพิ่มเติมตาราง 5) Themappedอัตราส่วนต่ำกว่าข้อมูล Illumina และเหตุผลอาจจะ thePacBio ที่อ่านที่มีความยาว และประกอบด้วยข้อผิดพลาดเพิ่มเติมกว่าอ่าน Illuminaเรายัง usedCEGMA ในการประเมินคุณภาพประกอบด้วย เราเปรียบเทียบการลำดับ Dendrobiumgenome กับชุดยีน eukaryotic หลัก CEGMA เรา-ไอเอ็นจี (http://korflab.ucdavis.edu/Datasets/cegma/) และพบว่าแทน 227 (91.5%) (ตาราง 6 เพิ่มเติม) สมบูรณ์ของ theDendrobiumgenome จะต่ำกว่าข้าวฟ่าง foxtail (Setaria italica)(99.19%), ซึ่งอาจจะเกิดจากการซ้ำเนื้อหาสูง ซึ่งผลกรอกของ D. officinalethan น้อยที่ foxtail ข้าวฟ่างที่สาม เราประเมินสัดส่วนของยีนขนาด scaffolds สัดส่วนของยีนขนาด scaffolds ต่ำขนาดรวมกลุ่มสามารถช่วยอธิบายความเชื่อถือของแอสเซมบลีสำหรับวัตถุประสงค์ในการค้นหายีน โดยใช้ชุดข้อมูลยีน 77 Ensembl เราสกัดล่าสุดโปรตีนเขียนคำอธิบายประกอบ forOryza sativa, Brachypodium distachyon ไบคัลเลอร์ ข้าวฟ่างกล้วย เกี่ยวข้อง Vitis vinifera, Populus trichocarpa
การแปล กรุณารอสักครู่..

จีโนมประเมินคุณภาพ
อ่านครั้งแรกของห้องสมุดขนาดเล็กแทรก (250, 500, 800 BP) ได้รับการจับคู่กับ
จีโนมประกอบในการประเมินคุณภาพของการชุมนุม '' PE แมป ''
หมายถึงอ่านถูกแมปกับจีโนมคู่ว่าอ่านแล้ว '' SE แผนที่เป็ด '' หมายถึงการอ่านที่ถูกแมปกับจีโนมเดียวอ่าน
และ '' UNIQ แมป '' หมายถึงอ่านถูกแมปกับจีโนม ใน
ภูมิภาคที่ไม่ซ้ำกัน อัตราส่วนแมปของข้อมูลขนาดเล็กแทรกเป็นมากกว่า
94% แสดงให้เห็นว่าส่วนใหญ่ของ theDendrobium officinalegenome ได้
รับการประกอบ (ตารางที่เสริม 4) นอกจากนี้เรายังใช้ Illumina สั้น
อ่านไป PacBio อ่านก่อนและหลังการแก้ไข LSC กับ BWA-Mem (เวอร์ชั่น 0.7.10-r789), การตั้งค่า theparameter เพื่อเป็นตัวแทนอ่านถูก
แมปกับจีโนมเป็น readpairs (ตารางที่เสริม 5) Themapped
อัตราส่วนต่ำกว่าข้อมูล Illumina และเหตุผลที่อาจเป็นไปได้ว่า thePacBio
อ่านมีความยาวและมีข้อผิดพลาดมากกว่า Illumina อ่าน.
นอกจากนี้เรายัง usedCEGMA ในการประเมินคุณภาพการชุมนุม เราเทียบ
ลำดับ Dendrobiumgenome กับชุดของยีน eukaryotic หลักเราไอเอ็นจี CEGMA (http://korflab.ucdavis.edu/Datasets/cegma/) และพบว่า
227 (91.5%) เป็นตัวแทน (ตารางที่เสริม 6) ความสมบูรณ์
ของ theDendrobiumgenome ต่ำกว่า Foxtail ข้าวฟ่าง (Setaria italica)
(99.19%) ซึ่งอาจจะเป็นเพราะเนื้อหาซ้ำสูงซึ่งส่งผล
ในการชุมนุมที่สมบูรณ์น้อยกว่าของดี officinalethan ที่ Foxtail ข้าวฟ่าง.
สามเราประเมินสัดส่วนของ โครงยีนขนาด สัดส่วน
ของโครงยีนขนาดครอบครองขนาดจีโนมทั้งหมดสามารถช่วย
อธิบายความน่าเชื่อถือของการชุมนุมเพื่อวัตถุประสงค์ในการหายีน ใช้
Ensembl 77 ข้อมูลยีนชุดเราสกัดโปรตีนเข้ารหัสล่าสุด
คำอธิบายประกอบ forOryza sativa, Brachypodium distachyon, ข้าวฟ่างสี,
กล้วยป่า, Elaeis guineensis, Vitis vinifera, Populus trichocarpa,
การแปล กรุณารอสักครู่..

การประเมินคุณภาพจีโนมตอนแรกอ่านของห้องสมุดใส่ขนาด 250 , 500 , 800 คู่เบส ) เป็นแมปไปยังการประกอบจีโนมเพื่อประเมินคุณภาพของการประกอบ ' ' ' 'pe แมปหมายถึงอ่านถูกแมปไปยังจีโนมเป็นอ่านคู่ ' เป็ด ' ' แสดงแผนที่ 'se อ่านถูกแมปไปยังจีโนมเป็นเดี่ยวอ่านว่าและ ' 'uniq แมป ' ' หมายถึงอ่านถูกแมปกับโครโมโซมในเฉพาะภูมิภาค การกำหนดอัตราส่วนของขนาดข้อมูลแทรกเล็กๆมากกว่า94 , แสดงให้เห็นว่าส่วนใหญ่ของ thedendrobium officinalegenome ได้การประกอบโต๊ะเสริม 4 ) เรายังใช้ Illumina สั้นอ่านไปอ่าน pacbio ก่อนและหลังการแก้ไข bwa-mem LSC ( 0.7.10-r789 รุ่น ) , การตั้งค่าพารามิเตอร์แสดงอ่านเป็นแมปจีโนมเป็น readpairs ( โต๊ะเสริม 5 ) themappedอัตราส่วนต่ำกว่า Illumina ข้อมูลและเหตุผล อาจจะ thepacbioอ่านยาว และมีข้อผิดพลาดมากกว่า Illumina คนอ่านเรายัง usedcegma ประเมินคุณภาพการประกอบ เราเปรียบเทียบลำดับ dendrobiumgenome กับชุดหลักความแตกต่างระหว่างยีนเราไอเอ็นจี cegma ( http://korflab.ucdavis.edu/datasets/cegma/ ) และพบว่า227 ( 91.5 % ) ( ตารางที่ 6 ) เสริม ) 2 .ของ thedendrobiumgenome กว่าหมาจิ้งจอกข้าวฟ่าง ( setaria italica )( 99.19 % ) ซึ่งอาจจะเนื่องจากเนื้อหาซ้ำสูง ซึ่ง ส่งผลให้ประกอบเสร็จสมบูรณ์ในน้อยกว่าวัน officinalethan ของหมาจิ้งจอกข้าวฟ่าง .สาม เราประเมินสัดส่วนของยีนขนาดนั่งร้าน สัดส่วนของยีนขนาดนั่งร้านครอบครองจีโนมขนาดรวมสามารถช่วยให้อธิบายถึงความน่าเชื่อถือของการชุมนุมที่ยีนหาวัตถุประสงค์ โดยใช้การ ensembl 77 ยีนชุดข้อมูล เราสกัดโปรตีนใหม่ล่าสุดนะครับfororyza , บันทึกย่อ , ข้าวฟ่าง , distachyon brachypodium ,กล้วยป่า , องุ่น , - คน trichocarpa vinifera , , ,
การแปล กรุณารอสักครู่..
