ความอุดมสมบูรณ์ของ phages ทั่วตัวอย่าง
ครอบคลุมการคำนวณถูก จำกัด ไปที่หน้าต่างครอบคลุม
ภูมิภาคที่กำหนดโดยฮิต spacer (โปรโตอวกาศ) และ phageassociated
ยีน นี่คือเพื่อให้แน่ใจว่าทำลายจุลินทรีย์เท่านั้น
อุดมสมบูรณ์วัดถ้ามันเป็นแบบบูรณาการในจีโนมของเชื้อแบคทีเรีย.
Metagenomic อ่านจากแต่ละตัวอย่างถูกแมปไปทำลายจุลินทรีย์
contigs โดยใช้ไทด์ที่ต้องใช้เวลาอย่างน้อย 80% ของการอ่านเพื่อให้สอดคล้อง
กับ contig ที่มีอย่างน้อย บัตรประจำตัว 85% ให้ประกาศว่าจะทำลายจุลินทรีย์
ที่มีอยู่ใน contig ตัวอย่างโดยเฉพาะอย่างยิ่งในภูมิภาคทำลายจุลินทรีย์ของ contig
จะต้องได้รับการคุ้มครองโดยอย่างน้อยหนึ่งอ่านต่อคู่ฐานและอย่างน้อย 70%
ของฐานทำลายจุลินทรีย์ภูมิภาคจะต้องได้รับการคุ้มครอง (ถ้าภูมิภาคทำลายจุลินทรีย์
เป็น <2 กิโลมันก็ขยายออกไปโดย 2 กิโลต้นน้ำและปลายน้ำ) ดู
ข้อความเพิ่มเติมสำหรับการอภิปรายในพารามิเตอร์เลือกสำหรับ
การวิเคราะห์ร่วมกัน ความคุ้มครองจะรายงานในอ่านต่อ kilobase ต่อ
ล้านอ่าน (RPKM) ข้อมูลภาพในความอุดมสมบูรณ์ทำลายจุลินทรีย์ทั่ว
ตัวอย่างพบที่ http://www.weizmann.ac.il/molgen/Sorek/
microbiome_phages /.
ความคล้ายคลึงกันของการดำรงอยู่ทำลายจุลินทรีย์โปรไฟล์
โปรไฟล์การดำรงอยู่ Phage สำหรับคู่ของกลุ่มตัวอย่างถูกนำมาเปรียบเทียบโดยใช้
ระยะทางที่ไม่สมมาตรไบนารีสัดส่วน ของฟาจที่มีอยู่ใน
เพียงหนึ่งตัวอย่างจากฟาจทั้งหมดที่มีอยู่ในอย่างน้อยหนึ่งของ
กลุ่มตัวอย่างในคู่.
อัตราของการค้นพบการวิเคราะห์
ตัวอย่าง MetaHIT ถูกเพิ่มในช่วงเวลาหนึ่ง หลังจากที่แต่ละตัวอย่างถูก
เพิ่มนับได้ทำทุก contigs ทำลายจุลินทรีย์ที่ไม่ซ้ำกันในการสะสม
ตัวอย่างที่มีการตรวจพบการใช้อวกาศที่พบใน
ตัวอย่างสะสมเหล่านั้น การวิเคราะห์ซ้ำ 10 ครั้ง
ที่มีการสั่งซื้อสินค้าตัวอย่างที่สุ่ม (Fisher-Yates สับ) สิบสี่ของ
กลุ่มตัวอย่างที่ไม่สามารถมีส่วนร่วมในอวกาศเนื่องจากลำดับสั้น
อ่าน.
กระจายของ contigs ทำลายจุลินทรีย์ในชุดข้อมูลอื่น ๆ
Reads ติดใจในบุคคลและจุดเวลาในการศึกษาแต่ละ
(โรคา et al, 2007;. เรเยส et al, 2010;. ไมนอตและคณะ 2011) ถูก
นำมาใช้ในรูปแบบสระว่ายน้ำการศึกษา สระว่ายน้ำแต่ละคนได้แมปไป MetaHIT
ทำลายจุลินทรีย์ contigs กับไทด์ที่ใช้ตัดตัวที่น้อยกว่า 85%
อย่างน้อย 85% ของความยาวอ่าน contig ทำลายจุลินทรีย์ก็ตัดสินใจที่
จะมีชีวิตอยู่ในชุดข้อมูลที่ถ้าภูมิภาคฟาจ (ตามที่ก่อนหน้านี้
ที่กำหนดไว้) ถูกปกคลุมด้วยอย่างน้อยหนึ่งอ่านต่อคู่ฐานและอย่างน้อย
70% ของฐานในภูมิภาคนี้ถูกปกคลุม สำหรับชุดข้อมูล VLP,
contigs ที่ล้มเหลวการทดสอบดังกล่าวข้างต้นได้ภายใต้การทดสอบครั้งที่สอง
กับชุดเดียวกันของพารามิเตอร์ข้ามความยาวทั้งหมดของ
contig ตั้งแต่สถานที่ของการทำแผนที่การอ่านในกรณีนี้ไม่จำเป็นต้อง
มีการควบคุมอย่างเคร่งครัด.
ความอุดมสมบูรณ์ของ HMP แบคทีเรีย
จีโนม HMP ฝากไว้ใน IMG มีนาคม 2011 ได้รับการสอบถามสำหรับ
ฟังก์ชั่น COG สอดคล้องกับ 31 ยีนสากลสำเนาเดียว
(Ciccarelli et al. 2006) ไทด์ที่มีธง -FF และ e-ค่า
เกณฑ์ของ 0.00005 ได้รับการดำเนินการโดยใช้ทั้งหมดอ่านจากแต่ละ
ตัวอย่างกับยีนสำเนาเดียวสากลจากสิ่งมีชีวิตเพื่อ
ที่อย่างน้อย 25 ของลำดับยีน 31 มีอยู่ เพียง
ฮิตระเบิดที่ดีที่สุดถูกนำสำหรับแต่ละอ่านและเฉพาะในกรณีที่ไม่น้อยกว่า 80% ของ
การอ่านชิดกับยีนของแบคทีเรียที่มีอย่างน้อย 85% ตัวตน.
ครอบคลุมวัดใน RPKM.
สภาของอาร์เรย์ CRISPR
ทั้งหมดอ่านที่ตรงกับชุดของที่รู้จักกัน CRISPR ซ้ำโดยใช้
ไทด์ที่มี e-มูลค่า 0.01 ถูกรวบรวมจากแต่ละ 110
บุคคลในข้อมูล MetaHIT ที่มีลำดับการอ่าน 75 bp.
QSRA ประกอบสั้นอ่าน (ไบรอันท์ et al. 2009) ได้ถูกนำมาใช้
ในการประกอบการเหล่านี้ อ่านในแต่ละแยกต่างหาก เพื่ออำนวยความสะดวก
การชุมนุมของ loci CRISPR ซ้ำอ่านได้รับการพิจารณาสำหรับการขยาย
ของอาร์เรย์ประกอบ แต่ถ้าพวกเขาจับคู่อย่างน้อยสุดท้าย
60 ฐาน contig การเจริญเติบโต (ตัวเลือก -u) หรือถ้าไม่เพียงพอของ
เหล่านี้มีอยู่อย่างน้อยที่ผ่านมา 50 ฐาน (ตัวเลือก -l).
หลักฐานสำหรับการรวม prophage
ไทด์ที่มีค่าเริ่มต้นถูกใช้ในการจัด contigs ทำลายจุลินทรีย์
บนชุดของจีโนม HMP บูรณาการ prophage ถูกกำหนด
ถ้าอย่างน้อย 1000 ฐาน contig ทำลายจุลินทรีย์ที่ได้สอดคล้องกับ
จีโนมของเชื้อแบคทีเรียที่มีอย่างน้อยตัวตน 95% และการจัดตำแหน่ง
ได้รับการแปลเป็นภาษาท้องถิ่นหนึ่งหรือทั้งสองด้านของ contig ฟาจ.
กิตติกรรมประกาศ
เราขอขอบคุณ Alejandro เรเยสและซามูเอลไมนอตสำหรับ น้ำใจของพวกเขา
ช่วยในการให้ข้อมูลลำดับ VLP เสริม นอกจากนี้เรายัง
ขอขอบคุณเด๊บบี้ลินเดลล์, EyalWeinstock, Dvir Dahary, Eytan Ruppin,
Hila Sberro-Livnat, Asaf ประกาศ OmriWurtzel กิล Amitai และ Shany
Doron สำหรับความคิดเห็นเกี่ยวกับต้นฉบับ อาร์เอสได้รับการสนับสนุนใน
ส่วนโดยโปรแกรม ERC-สาบาน (ทุน 260,432), ลีโอนา M. และ
แฮร์รี่บีสลีย์ไว้ใจและโดยให้กรมทรัพย์สินทางปัญญาจาก
สหพันธ์สาธารณรัฐ ตามที่ได้รับประโยชน์จาก
ทุนหลังปริญญาเอกจากกองทุนวิจัยแอกซ่า EM ได้รับการสนับสนุน,
ส่วนโดยคบหาจากเอดมันด์เจ Safra Bioinformatics
โปรแกรมที่ Tel Aviv มหาวิทยาลัย ไอทีได้รับการสนับสนุนโดย
ศูนย์ Clore ที่สถาบันวิทยาศาสตร์ Weizmann
การแปล กรุณารอสักครู่..
