Sequence processing and statistical analysis
Sequence processing was conducted in QIIME (Caporaso et al., 2010) using
MacQiime (version 1.6.0, http://www.wernerlab.org/software/macqiime; QIIME,
RRID:OMICS 01521). Quality filtered forward reads (Phred score > 20; 250 bp) were
binned with barcodes corresponding to the respective sample IDs. Operational taxonomic
units (OTUs) were assigned at 99% genetic similarity. Representative OTU sequences
were aligned to the Greengenes database (October 2012 version) and assigned taxonomic
nomenclature with an RDP classifier. We rarified all samples to 19,000 sequences for even
sampling depth; two samples significantly below that threshold were omitted from further
analysis.
We also conducted a manual BLAST search against the NCBI 16S isolate database for the
top 10 OTUs for exploratory purposes (NCBI BLAST, RRID:nlx 84530). We included these
species-level NCBI database matches for visualization and reporting. Results from OTU
clustering matched to the Greengenes database using an RDP classifier within the QIIME
pipeline were used for all analysis purposes.
Community similarity was calculated in two different ways: with the phylogeny-based
UniFrac metric (unweighted), and by calculating the number of OTUs shared between
samples. Unweighted UniFrac uses phylogeny-based branch lengths generated from our
rarified dataset, comparing their fractions between samples to quantify dissimilarity
between communities without regard for species abundance. We determined if differences
were significant using PERMANOVA (Adonis method) in QIIME. Using the UniFrac matrix,
we generated a PCoA plot in QIIME and included it as Fig. 4. We then used the QIIME
generated OTU table to conduct a one-way ANOVA in SPSS (SPSS, RRID:rid 000042,
version 20.0.0) to investigate differences in the number of shared OTUs across households
and across villages (Fig. 3).
Sequence processing and statistical analysisSequence processing was conducted in QIIME (Caporaso et al., 2010) usingMacQiime (version 1.6.0, http://www.wernerlab.org/software/macqiime; QIIME,RRID:OMICS 01521). Quality filtered forward reads (Phred score > 20; 250 bp) werebinned with barcodes corresponding to the respective sample IDs. Operational taxonomicunits (OTUs) were assigned at 99% genetic similarity. Representative OTU sequenceswere aligned to the Greengenes database (October 2012 version) and assigned taxonomicnomenclature with an RDP classifier. We rarified all samples to 19,000 sequences for evensampling depth; two samples significantly below that threshold were omitted from furtheranalysis.We also conducted a manual BLAST search against the NCBI 16S isolate database for thetop 10 OTUs for exploratory purposes (NCBI BLAST, RRID:nlx 84530). We included thesespecies-level NCBI database matches for visualization and reporting. Results from OTUclustering matched to the Greengenes database using an RDP classifier within the QIIMEpipeline were used for all analysis purposes.Community similarity was calculated in two different ways: with the phylogeny-basedUniFrac metric (unweighted), and by calculating the number of OTUs shared betweensamples. Unweighted UniFrac uses phylogeny-based branch lengths generated from ourrarified dataset, comparing their fractions between samples to quantify dissimilaritybetween communities without regard for species abundance. We determined if differenceswere significant using PERMANOVA (Adonis method) in QIIME. Using the UniFrac matrix,we generated a PCoA plot in QIIME and included it as Fig. 4. We then used the QIIMEgenerated OTU table to conduct a one-way ANOVA in SPSS (SPSS, RRID:rid 000042,version 20.0.0) to investigate differences in the number of shared OTUs across householdsand across villages (Fig. 3).
การแปล กรุณารอสักครู่..
การประมวลผลตามลำดับและการวิเคราะห์ทางสถิติการประมวลผลลำดับได้ดำเนินการใน QIIME ใช้ (Caporaso et al, 2010). MacQiime (เวอร์ชั่น 1.6.0, http://www.wernerlab.org/software/macqiime; QIIME, RRID: omics 01521) คุณภาพกรองไปข้างหน้าอ่าน (คะแนน Phred> 20 250 bp) ถูกbinned กับบาร์โค้ดที่ตรงกับรหัสตัวอย่างที่เกี่ยวข้อง การจัดหมวดหมู่การดำเนินงานหน่วย (Otus) ที่ได้รับมอบหมายที่ 99% ความคล้ายคลึงกันทางพันธุกรรม ตัวแทน OTU ลำดับถูกจัดชิดกับฐานข้อมูลGreengenes (ตุลาคม 2012 รุ่น) และได้รับมอบหมายอนุกรมวิธานศัพท์กับลักษณนามRDP เรา rarified ตัวอย่างทั้งหมด 19,000 ลำดับแม้ลึกสุ่มตัวอย่าง; สองตัวอย่างอย่างมีนัยสำคัญต่ำกว่าเกณฑ์ที่ถูกตัดออกจากต่อการวิเคราะห์. นอกจากนี้เรายังดำเนินการค้นหาระเบิดกับคู่มือ NCBI 16S แยกฐานข้อมูลสำหรับ10 อันดับแรก Otus เพื่อวัตถุประสงค์ในการสำรวจ (NCBI ระเบิด, RRID: NLX 84530) เราเหล่านี้รวมถึงสายพันธุ์ที่ระดับฐานข้อมูล NCBI ตรงสำหรับการแสดงและการรายงาน ผลลัพธ์ที่ได้จาก OTU การจัดกลุ่มจับคู่กับฐานข้อมูล Greengenes ใช้ลักษณนาม RDP ภายใน QIIME ท่อถูกนำมาใช้เพื่อวัตถุประสงค์ในการวิเคราะห์ทั้งหมด. ความคล้ายคลึงกันของชุมชนที่คำนวณได้ในสองวิธีที่แตกต่างกันด้วยเชื้อชาติตามUniFrac ตัวชี้วัด (ชั่ง) และโดยการคำนวณจำนวน Otus ร่วมกันระหว่างกลุ่มตัวอย่าง ชั่ง UniFrac ใช้ความยาวสาขาเชื้อชาติตามที่เกิดจากของเราชุดrarified เปรียบเทียบระหว่างเศษส่วนของพวกเขาที่จะหาจำนวนตัวอย่างความแตกต่างกันระหว่างชุมชนโดยไม่คำนึงถึงความอุดมสมบูรณ์ชนิด ถ้าเรากำหนดความแตกต่างอย่างมีนัยสำคัญโดยใช้ PERMANOVA (วิธีอิเหนา) ใน QIIME การใช้เมทริกซ์ UniFrac, เราสร้างพล็อตใน QIIME PCoA และรวมเป็นรูป 4. จากนั้นเราจะใช้ QIIME สร้างตาราง OTU ที่จะดำเนินการทางเดียว ANOVA ใน SPSS (SPSS, RRID: กำจัด 000042, รุ่น 20.0.0) เพื่อตรวจสอบความแตกต่างในจำนวน Otus ที่ใช้ร่วมกันทั่วทั้งผู้ประกอบการและทั่วหมู่บ้าน(รูปที่ 3. )
การแปล กรุณารอสักครู่..