30 -maxScore -500 -nproc 48 -noSplitSubreads’’ for protocol
file. Then, we used the SSPACE (version 2.0) (Boetzer et al., 2011) with
default parameters to extend the length of scaffolds for the raw
assembly (http://bioinformatics.oxfordjournals.org/content/early/2010/12/
12/bioinformatics.btq683.short)(Supplemental Table 28).
We used the Rabbit (You et al., 2013) software to remove redundant
sequences. The Rabbit software (ftp://ftp.genomics.org.cn/pub/
Plutellaxylostella/) was developed based on the Poisson-based K-mer
model, which needs a table of K-mer frequencies to determine redundant
sequences. We utilized the Jellyfish (Biowire, San Francisco, CA) to
generate the table with recommended parameter K = 16 bp from
200 bp, 500 bp, and 800 bp libraries using the following commands: ‘‘gun-zip –c WGS.fq.gzjjellyfish count -m 16 -o k16mer –timing k16mer.time -s
4294967296 -t 32 -c 8 -C /dev/fd/0 1>k16mer.log 2>k16mer.error; jellyfish
merge -v -o k16mer.jf k16mer_* 1>>k16mer.log 2>>k16mer.error; jellyfish
dump -c -t -o k16mer.dump k16mer.jf 1>>k16mer.log 2>>k16mer.error;
jellyfish stats -o k16mer.stats k16mer.jf 2>>k16mer.error; jellyfish histo
-t 32 k16mer.jfj sed ’s/ //g’ >k16mer.histo’’. After obtaining the 16-mer
occurrence frequency table, we removed redundancy, mainly using the
Redundancy Remover module of the Rabbit software (Supplemental
Table 29).
Gaps between contigs were closed by Gapcloser version 1.10 with
the default parameters (v1.12, http://soap.genomics.org.cn/down/
GapCloser_release_2011.tar.gz)(Supplemental Table 30). Redundancy
was removed again to obtain the final assembled genome
(Supplemental Table 31). In the whole process of assembly, the smallest
contig cutoff was 100 bp. As the contig and scaffold N50 improved
significantly after removing redundant sequences in SSPACE (Boetzer
et al., 2011) extended genome assembly, we obtained statistics of
scaffold length before and after removing redundancy and the length
distribution of the assembled genome after every step, which shows,
from 100 bp to 50 kb, that many short sequences were removed, which
may contribute to the increase of contig N50 and scaffold N50
(Supplemental Figure 18andSupplemental Tables 27–32).
30 -maxScore -500 -nproc 48 -noSplitSubreads '' สำหรับโปรโตคอล
ไฟล์ จากนั้นเราจะใช้ SSPACE (เวอร์ชั่น 2.0) (Boetzer et al., 2011) โดยมี
ค่าเริ่มต้นที่จะขยายความยาวของโครงสำหรับดิบ
สหประชาชาติ (http://bioinformatics.oxfordjournals.org/content/early/2010/12/
12 / bioinformatics.btq683.short) (เพิ่มเติมตารางที่ 28).
เราใช้กระต่าย (คุณ et al., 2013) ซอฟแวร์ที่จะลบซ้ำซ้อน
ลำดับ ซอฟแวร์กระต่าย (ftp://ftp.genomics.org.cn/pub/
Plutellaxylostella /) ได้รับการพัฒนาบนพื้นฐานของ Poisson ตาม K-Mer
รุ่นที่ต้องการตารางความถี่ K-Mer เพื่อตรวจสอบซ้ำซ้อน
ลำดับ เราใช้แมงกะพรุน (Biowire, San Francisco, CA) จะสามารถ
สร้างตารางที่มีพารามิเตอร์ที่แนะนำ K = 16 bp จาก
200 BP, BP 500, และ 800 bp ห้องสมุดโดยใช้คำสั่งต่อไปนี้: '' ปืนซิป -c WGS.fq. gzjjellyfish นับ -m 16 -o k16mer -timing k16mer.time -s
4294967296 t-32-c 8 -C / dev / FD / 0 1> k16mer.log 2> k16mer.error; แมงกะพรุน
ผสาน -v -o k16mer.jf k16mer_ * 1 >> k16mer.log 2 >> k16mer.error; แมงกะพรุน
ถ่ายโอนข้อมูล -c -t -o k16mer.dump k16mer.jf 1 >> k16mer.log 2 >> k16mer.error;
สถิติแมงกะพรุน -o k16mer.stats k16mer.jf 2 >> k16mer.error; HISTO แมงกะพรุน
t-32 k16mer.jfj SED 'S / // g'> k16mer.histo '' หลังจากได้รับ 16-Mer
ตารางความถี่ที่เกิดขึ้นเราได้นำความซ้ำซ้อนส่วนใหญ่ใช้
โมดูลซ้ำซ้อน Remover ของซอฟต์แวร์กระต่าย (เพิ่มเติม
ตารางที่ 29).
ช่องว่างระหว่าง contigs ถูกปิดโดย Gapcloser 1.10 รุ่นกับ
พารามิเตอร์เริ่มต้น (v1.12 http: //soap.genomics.org.cn/down/
GapCloser_release_2011.tar.gz) (เพิ่มเติมตารางที่ 30) ซ้ำซ้อน
จะถูกลบออกอีกครั้งที่จะได้รับจีโนมประกอบขั้นสุดท้าย
(เพิ่มเติมตารางที่ 31) ในกระบวนการทั้งหมดของการชุมนุมที่เล็กที่สุด
ตัด contig 100 bp ในฐานะที่เป็น contig และนั่งร้าน N50 ดีขึ้น
อย่างมีนัยสำคัญหลังจากที่ถอดลำดับซ้ำซ้อนใน SSPACE (Boetzer
et al. 2011) ประกอบจีโนมขยายเราได้รับข้อมูลทางสถิติของ
ความยาวนั่งร้านก่อนและหลังการลบความซ้ำซ้อนและความยาวของ
การกระจายตัวของจีโนมประกอบหลังจากที่ทุกขั้นตอนซึ่ง การแสดง
จาก 100 bp 50 KB, ว่าลำดับสั้นจำนวนมากถูกถอดออกซึ่ง
อาจนำไปสู่การเพิ่มขึ้นของ contig N50 และ N50 นั่งร้าน
(เพิ่มเติมรูป 18andSupplemental ตาราง 27-32)
การแปล กรุณารอสักครู่..

30 - maxscore - 500 - nproc 48 - nosplitsubreads < / blasr ' ' สำหรับโปรโตคอลไฟล์ แล้วเราใช้ sspace ( เวอร์ชั่น 2.0 ) ( boetzer et al . , 2011 )พารามิเตอร์เริ่มต้นที่ขยายความยาวของนั่งร้านสำหรับดิบ( http://bioinformatics.oxfordjournals.org/content/early/2010/12/ ประกอบ12 / ชีวสารสนเทศ btq683 สั้น ) ( เสริมตารางที่ 28 )เราใช้กระต่าย ( คุณ et al . , 2013 ) ซอฟต์แวร์เพื่อลบแทนลำดับ กระต่าย ( ftp://ftp.genomics.org.cn/pub/ ซอฟต์แวร์plutellaxylostella / ) ถูกพัฒนาขึ้นบนพื้นฐานจาก k-mer ปัวส์ซองรูปแบบซึ่งต้องการโต๊ะ k-mer ความถี่เพื่อตรวจสอบแทนลำดับ เราใช้แมงกะพรุน ( biowire , ซานฟรานซิสโก , CA )สร้างตารางที่มีค่า K = 16 เบสแนะนำ200 / 500 / 800 / ห้องสมุดโดยใช้คำสั่งต่อไปนี้ : ' 'gun-zip –ซี wgs.fq.gzjjellyfish นับ - M 16 - o k16mer –เวลา k16mer.time - s4294967296 - 32 - C 8 - C / dev / FD / 0 1 > 2 > k16mer.log k16mer.error ; แมงกะพรุนผสาน - v - o k16mer.jf k16mer_ * 1 > > 2 > > k16mer.log k16mer.error ; แมงกะพรุนทิ้ง - C - t - o k16mer.dump k16mer.jf 1 > > 2 > > k16mer.log k16mer.error ;แมงกะพรุนสถิติ - o k16mer.stats k16mer.jf 2 > > k16mer.error ; histo แมงกะพรุน- 32 k16mer.jfj sed ' s / / / G ' > k16mer . histo ' ' หลังจากที่ได้รับ 16 แมร์ตารางความถี่ที่เกิดขึ้น เราได้ลบความซ้ำซ้อน ส่วนใหญ่ใช้ความซ้ำซ้อน Remover ซอฟต์แวร์โมดูลของกระต่าย ( เสริมตารางที่ 29 )ช่องว่างระหว่างสูงถูกปิดโดย gapcloser รุ่น 1.10 กับค่าพารามิเตอร์ ( v1.12 http://soap.genomics.org.cn/down/ ,gapcloser_release_2011 . tar . gz ) ( เสริมโต๊ะ 30 ) ความซ้ำซ้อนออกอีกครั้งเพื่อให้ได้สุดท้ายประกอบจีโนม( เสริมตารางที่ 31 ) ในกระบวนการทั้งหมดของการชุมนุมน้อยที่สุดcontig ตัด 100 BP . เป็น contig นั่งร้าน 50 และขึ้นอย่างมากหลังจากลบลำดับใน sspace ( boetzer แทนet al . , 2011 ) การประกอบจีโนม ขยาย เราได้สถิตินั่งร้านความยาวก่อนและหลังขจัดความซ้ำซ้อนและความยาวการประกอบจีโนมหลังจากทุกขั้นตอน ซึ่งแสดงให้เห็นว่าจาก 100 BP 50 kb ที่ลำดับสั้นมากออก ซึ่งอาจนำไปสู่การเพิ่มขึ้นของ contig นั่งร้าน 50 50 และ( เพิ่มเติมรูป 18andsupplemental โต๊ะ 27 ( 32 )
การแปล กรุณารอสักครู่..
