Error Correction of PacBio Reads
The LSC0.3.1 software (Au et al., 2012) was used for PacBio reads error
correction with all the Hiseq 2000 short reads. There are five main steps
in LSC: HC transformation, SR quality control, SR-LR alignment, error
correction, and decompression transformation. First, the PacBio reads
and Illumina reads are transformed by homopolymer compression so
that each homopolymer run is replaced by a single nucleotide of the
same type. Then, LSC filters out compressed Illumina reads that have
less than 40 non-N nucleotides or have more than one N by default. HC
points, point mismatches, deletions, and insertions are the four types of
correction points in the error correction step. At each correction point of
the first three types, all the Illumina reads that cover it are decompressed
temporarily, and the consensus sequence replaces this correction point.
For insertion points, the consensus decompressed sequence inserts at
this point if the majority of aligned Illumina reads have insertions at this
point. After all correction points are replaced, all the uncorrected HC
points are decompressed (Au et al., 2012).
The correction parameter optionswere set as: ‘‘#bowtie2_options = –end-to-end -a -f -L 15 –mp 1,1 –np 1 –rdg 0, 1 –rfg 0, 1 –score-min L, 0, 0.08
–no-unal; bowtie2_options = –end-to-end -p 32 –very-fast -a -f –mp
1,1 –np 1 –rdg 0,1 –rfg 0,1 –score-min L,0,0.08 –no-unal; rezars3
การแก้ไขข้อผิดพลาดการอ่าน PacBioซอฟต์แวร์ LSC0.3.1 (Au et al. 2012) ใช้สำหรับข้อผิดพลาดในการอ่าน PacBioการแก้ไขทั้งหมด Hiseq 2000 สั้นอ่าน มี 5 ขั้นตอนหลักใน LSC: HC SR LR จัด ควบคุมคุณภาพ SR การแปลง ข้อผิดพลาดการแก้ไข และการเปลี่ยนแปลงการบีบอัด ครั้งแรก PacBio การอ่านและอ่าน Illumina กลายเกิดโฮโมอัดดังนั้นว่า แต่ละการเกิดโฮโมรันถูกแทนที่ ด้วยนิวคลีโอไทด์เดี่ยวของการชนิดเดียวกัน แล้ว LSC กรองอ่าน Illumina บีบอัดที่มีนิวคลีโอไทด์-N 40 น้อยกว่า หรือมีมากกว่าหนึ่ง N โดยค่าเริ่มต้น HCจุด จุดไม่ตรงกัน การลบ และแทรกมีสี่ประเภทจุดแก้ไขในขั้นตอนการแก้ไขข้อผิดพลาด จุดแต่ละการแก้ไขประเภทแรกสาม อ่าน Illumina ทั้งหมดที่ครอบคลุมคือ decompressedชั่วคราว และลำดับฉันทามติแทนการแก้ไขจุดนี้สำหรับจุดแทรก แทรกลำดับที่ถูกแตกมติจุดนี้ถ้าส่วนใหญ่อ่าน Illumina ชิดมีการแทรกที่นี้จุด หลังจากการแก้ไขจุดทั้งหมดจะถูกแทนที่ HC ที่ uncorrected ทั้งหมดคะแนนจะถูกแตก (Au et al. 2012)Optionswere พารามิเตอร์การแก้ไขการตั้งค่าเป็น: '' #bowtie2_options = – สิ้นสุด-ถึง-จบ--f -L 15 – mp 1.1 – np 1 – เกย์ตรวจจับ 0, 1 – rfg 0 คะแนน 1 – -นาที L, 0, 0.08-ไม่มี-unal bowtie2_options = – ปลาย-ถึง-จบ -p 32 – มาก-รวดเร็ว--f – mp1.1 – np 1 – เกย์ตรวจจับ 0, 1 – rfg 0,1 – คะแนน-นาที L, 0, 0.08 – ไม่มี-unal rezars3
การแปล กรุณารอสักครู่..

แก้ไขข้อผิดพลาดของ PacBio อ่าน
ซอฟต์แวร์ LSC0.3.1 (ที่ Au et al., 2012) ที่ใช้สำหรับ PacBio อ่านข้อผิดพลาด
การแก้ไขกับทุก Hiseq 2000 สั้นอ่าน มีห้าขั้นตอนหลัก
ใน LSC: HC เปลี่ยนแปลงการควบคุมคุณภาพอาร์, SR-LR จัดตำแหน่งข้อผิดพลาด
การแก้ไขและการเปลี่ยนแปลงการบีบอัด ครั้งแรกที่ PacBio อ่าน
และอ่าน Illumina มีการเปลี่ยนแปลงโดยการบีบอัด homopolymer เพื่อ
ให้แต่ละ homopolymer วิ่งจะถูกแทนที่ด้วยเดี่ยวเบื่อหน่ายของ
ชนิดเดียวกัน จากนั้นกรองเอา LSC บีบอัด Illumina อ่านที่มี
น้อยกว่า 40 ไม่ใช่-N นิวคลีโอหรือมีมากกว่าหนึ่ง N โดยค่าเริ่มต้น HC
จุดที่ไม่ตรงกันจุดลบและการแทรกเป็นสี่ประเภทของ
จุดแก้ไขในขั้นตอนการแก้ไขข้อผิดพลาด ในแต่ละจุดแก้ไข
สามประเภทแรกทั้งหมด Illumina อ่านปกว่ามันจะแตก
ชั่วคราวและลำดับฉันทามติแทนที่จุดแก้ไขนี้.
สำหรับจุดแทรกความเห็นแตกลำดับแทรกที่
จุดนี้ถ้าส่วนใหญ่สอดคล้อง Illumina อ่านได้ แทรกนี้
จุด หลังจากที่ทุกจุดที่แก้ไขจะถูกแทนที่ทุก HC แก้ไข
(. Au et al, 2012). จุดแตก
พารามิเตอร์แก้ไข optionswere ตั้งเป็น: '' # bowtie2_options = -End-to-end -a -f -L 15 -mp 1,1 -np 1 -rdg 0, 1 -rfg 0, 1 -score นาที L, 0, 0.08
ไม่มี-Unal; bowtie2_options = -End-to-end-p 32 สนเนี้อได้อย่างรวดเร็ว -a -f -mp
1,1 -np 1 -rdg 0,1 0,1 -rfg -score นาที L, 0,0.08 ไม่มี-Unal ; rezars3
การแปล กรุณารอสักครู่..

การแก้ไขข้อผิดพลาดของ pacbio อ่านการ lsc0.3.1 ซอฟต์แวร์ ( AU et al . , 2012 ) ใช้ pacbio อ่านข้อผิดพลาดแก้ไขกับทุก hiseq 2000 สั้นคนอ่าน มีห้าขั้นตอนหลักในการแปลง , HC , การควบคุม , SR sr-lr แนวคุณภาพ ข้อผิดพลาดแก้ไข , การบีบอัดและการเปลี่ยนแปลง pacbio อ่านครั้งแรกจะเปลี่ยนจากการบีบอัด และ Illumina อ่านโฮโมโพลิเมอร์ ดังนั้นแต่ละโฮโมพอลิเมอร์วิ่งถูกแทนที่ด้วยซิงเกิลนิวคลีโอไทด์ของเดียวกันชนิด งั้น , กรองอัด Illumina อ่านที่มีน้อยกว่า 40 non-n นิวคลีโอไทด์ หรือมีมากกว่าหนึ่ง ( โดยค่าเริ่มต้น HCจุด , จุด และความไม่ลบ , ใหม่เป็น 4 ประเภทจุดแก้ไขในการแก้ไขข้อผิดพลาดขั้นตอน การแก้ไขในแต่ละจุดของสามประเภทแรก ทั้งหมดที่ครอบคลุมมันเป็น decompressed Illumina อ่านชั่วคราวและฉันทามติลำดับแทนที่นี้แก้ไขจุดสำหรับจุดแทรก เอกฉันท์ decompressed แทรกลำดับที่จุดนี้ถ้าส่วนใหญ่ของชิด Illumina อ่านได้ครั้งนี้จุด หลังจากจุดแก้ไขทั้งหมดจะถูกแทนที่ทั้งหมด uncorrected HCจุด decompressed ( AU et al . , 2012 )การแก้ไขพารามิเตอร์ optionswere ตั้งเป็น : ' ' # bowtie2_options = – end - A - F - 15 ––– rdg NP 1 , 1 , 1 , 0 , rfg 1 – 0 , 1 และ 0 , 0.08 คะแนนมิน Lรวมทั้ง bowtie2_options Unal ; = ) ) - P 32 –รวดเร็วมาก - A - F - ส.1 , 1 ( NP 1 – rdg 0.1 และ 0.1 – rfg คะแนนมิน L ต่างกัน 0.08 –ไม่ rezars3 Unal ;
การแปล กรุณารอสักครู่..
