2.3. Mitogenome assembly
The mitochondrial metagenomics assembly pipeline of
Crampton-Platt et al. (2015) was used with a few modifications.
First, FastQC (Andrews, 2010) was used to check the quality of
the raw data. Adapters and index motifs were removed from this
dataset using Trimmomatic (Bolger et al., 2014) and subsequently
the data were filtered for mitochondrial reads using a BLAST search
(Altschul et al., 1990) against a custom reference database of 3806
full and partial mitogenome sequences of Coleoptera (E = 1e5)
with no restriction in length overlap. Filtered reads from both
libraries were combined into a single dataset and the resulting
read files were trimmed using Prinseq to remove short and lowquality
reads (Schmieder and Edwards, 2011). IDBA-UD (Peng
et al., 2012) was used for the assembly of the extracted mtDNA
reads. The resulting contigs were filtered for mtDNA hits against
the Coleoptera mitogenome database (E = 1e5) for sequences
with more than 1000 base pairs overlap.
tRNA annotations were mapped on each contig using COVE
(Eddy and Durbin, 1994). The annotated contigs were tested for
circular genome maps (identical sequences at both ends of the contig)
in Geneious version R8.0.5 (Kearse et al., 2012). Protein- and
ribosomal RNA (rRNA) coding genes were extracted using FeatureExtract
1.2 (Wernersson, 2005) and annotated against the
mitochondrial genome of Tribolium castaneum (GenBank:
NC_003081) in Geneious.
2.3 Mitogenome ประกอบ
metagenomics ยลประกอบท่อ
แครมป์ตัน-et al, แพลต (2015) ถูกนำมาใช้กับการปรับเปลี่ยนไม่กี่.
แรก FastQC (แอนดรู 2010) ถูกใช้ในการตรวจสอบคุณภาพของ
ข้อมูลดิบ อะแดปเตอร์และลวดลายดัชนีถูกถอดออกจาก
ชุดข้อมูลที่ใช้ Trimmomatic (โบลเจอร์ et al., 2014) และต่อมา
ข้อมูลที่ถูกกรองยลอ่านใช้การค้นหาระเบิด
(Altschul et al., 1990) กับฐานข้อมูลอ้างอิงที่กำหนดเองของ 3806
เต็มรูปแบบและบางส่วน ลำดับ mitogenome ของ Coleoptera (E = 1E? 5)
ที่มีข้อ จำกัด ในความยาวทับซ้อนไม่มี กรองอ่านจากทั้ง
ห้องสมุดถูกรวมกันเป็นชุดเดียวและผล
ไฟล์อ่านได้รับการตัดแต่งใช้ Prinseq จะลบในระยะสั้นและ lowquality
อ่าน (Schmieder และเอ็ดเวิร์ด 2011) IDBA-UD (Peng
et al., 2012) ถูกนำมาใช้สำหรับการชุมนุมของ mtDNA สกัด
อ่าน contigs ส่งผลให้ถูกกรองสำหรับ mtDNA กระทบกับ
ฐานข้อมูล mitogenome Coleoptera (E = 1E? 5) สำหรับลำดับ
ที่มีมากกว่า 1,000 คู่เบสทับซ้อน.
คำอธิบายประกอบ tRNA ถูกแมปในแต่ละ contig ใช้ COVE
(เอ็ดดี้และเดอร์บิน 1994) contigs ข้อเขียนได้รับการตรวจ
แผนที่จีโนมวงกลม (ลำดับที่เหมือนกันที่ปลายของ contig ทั้งสอง)
ในรุ่น Geneious R8.0.5 (Kearse et al., 2012) โปรตีนและ
RNA ไรโบโซม (rRNA) รหัสพันธุกรรมถูกสกัดโดยใช้ FeatureExtract
1.2 (Wernersson, 2005) และมีคำอธิบายประกอบกับ
จีโนมยล Tribolium castaneum (GenBank:
NC_003081) ใน Geneious
การแปล กรุณารอสักครู่..

2.3 mitogenome ประกอบตัดประกอบท่อของเมตะจีโนมิกแครมป์ตัน แพลท et al . ( 2015 ) ถูกนำมาใช้กับการปรับเปลี่ยนไม่กี่ .แรก fastqc ( แอนดรู , 2010 ) คือใช้ในการตรวจสอบคุณภาพของข้อมูลดิบ อะแดปเตอร์และดัชนีที่สำคัญถูกลบออกจากนี้ข้อมูลการใช้ trimmomatic ( โบลเจอร์ et al . , 2010 ) และในภายหลังข้อมูลกรองสำหรับการอ่านโดยใช้บริการค้นหา( แอลเชิล et al . , 1990 ) กับฐานข้อมูลของ 3806 เองอ้างอิงเต็มรูปแบบและบางส่วน mitogenome ลำดับ Coleoptera ( E = 1e5 )ไม่มีข้อ จำกัด ในความยาวที่ทับซ้อนกัน อ่านทั้งกรองห้องสมุดรวมกันเป็นชุดข้อมูลเดียวและผลไฟล์อ่านถูกตัดการใช้ prinseq ลบในระยะสั้นและ lowqualityอ่าน ( และ schmieder Edwards , 2011 ) idba-ud ( เป็งet al . , 2012 ) คือใช้สำหรับประกอบการแสดงสกัดอ่าน ซึ่งถูกกรองเพื่อแสดงความนิยมสูงกับฐานข้อมูล Coleoptera mitogenome ( E = 1e5 ) สำหรับลำดับที่มีมากกว่า 1 , 000 คู่เบสที่ทับซ้อนกันทีอาร์เอ็นเอ เครื่องหมายถูกแมปในแต่ละ contig ใช้โคฟ( เอ็ดดี้ และ เดอร์บิน , 1994 ) การบันทึกย่อสูง ทดสอบแผนที่จีโนมแบบวงกลม ( ลำดับเหมือนกันที่ปลายทั้งสองของ contig )ใน geneious รุ่น r8.0.5 ( เคิร์ส et al . , 2012 ) โปรตีนและไรโบโซมอล อาร์เอ็นเอ ( rRNA ยีนถูกสกัดโดยใช้ featureextract ) นะครับ1.2 ( wernersson , 2005 ) และบันทึกย่อกับยลจีโนมของ tribolium castaneum ( ขนาด :nc_003081 ) ใน geneious .
การแปล กรุณารอสักครู่..
