To investigate smaller CNVs, we determined the copy number (CN) for each gene in every sample by normalising the median gene coverage by the haploid coverage of the respective chromosome (see Materials and methods). CN variation affected 91.5% of genes (7,625 / 8,330; Figure 8A, Supplementary file 9), but most CNVs are rare (Figure 8A). Only 3.6% of all genes (304) showed a median copy number change ( < = -1 or > = 1) across samples with 103 genes decreased and 201 increased, respectively (Figure 8B). Enrichment tests for the 103 genes with frequently reduced copy number showed GO term enrichments for the biological processes “cation transport”, “transmembrane transport”, “fatty acid biosynthesis” and “localization” (median CN change across samples < = 1, Supplementary file 10). The 201 genes that were regularly increased showed enrichment for several terms including but not exclusive to “modulation by symbiont of host protein kinase-mediated signal transduction”, “cell adhesion” and “drug catabolic process” (median CN change across samples > = 1, for full list see Supplementary file 10). Only a subset of 52 genes (0.6%) showed frequently high gene copy number increases (median > = 4 across all samples). Enriched GO terms largely overlapped with enrichments of genes including small CN increases with the additional enrichment of “response to active oxygen species” (Supplementary file 10). Those categories might indicate functions on which there is frequent or strong selection pressure. Median gene copy number was positively correlated among groups (Figure 8C, Pearson correlation for pairwise comparisons between 0.8 and 0.91). Despite this extensive variation and shared copy number variation across groups, gene copy number still retained some phylogenetic signal (Figure 8D).
ในการตรวจสอบ CNV ที่เล็กกว่า เราได้กำหนดหมายเลขการคัดลอก (CN) สำหรับแต่ละยีนในทุกตัวอย่างโดยการปรับความครอบคลุมของยีนค่ามัธยฐานให้เป็นปกติโดยการครอบคลุมเดี่ยวของโครโมโซมตามลำดับ (ดูวัสดุและวิธีการ) การเปลี่ยนแปลงของ CN ส่งผลต่อยีน 91.5% (7, 625 / 8, 330; รูปที่ 8A, ไฟล์เสริม 9) แต่ CNV ส่วนใหญ่จะหายาก (รูปที่ 8A) มีเพียง 3.6% ของยีนทั้งหมด (304) เท่านั้นที่แสดงการเปลี่ยนแปลงจำนวนสำเนามัธยฐาน ( < = -1 หรือ > = 1) ในกลุ่มตัวอย่างที่มี 103 ยีนลดลงและ 201 เพิ่มขึ้นตามลำดับ (รูปที่ 8B) การทดสอบการเพิ่มคุณค่าสำหรับยีน 103 ตัวที่มีจำนวนสำเนาลดลงบ่อยครั้งแสดงให้เห็นว่าการเพิ่มคุณค่าระยะ GO สำหรับกระบวนการทางชีวภาพ "การขนส่งไอออนบวก", "การขนส่งผ่านเมมเบรน", "การสังเคราะห์กรดไขมัน" และ "การแปลเป็นภาษาท้องถิ่น" (ค่ามัธยฐานการเปลี่ยนแปลง CN ข้ามตัวอย่าง < = 1, ไฟล์เสริม 10) ยีน 201 ที่เพิ่มขึ้นเป็นประจำแสดงให้เห็นการเสริมสมรรถนะสำหรับคำศัพท์หลายคำ ซึ่งรวมถึงแต่ไม่จำกัดเฉพาะ "การปรับโดยซิมไบโอนท์ของการถ่ายโอนสัญญาณที่ใช้สื่อกลางไคเนสของโปรตีนโฮสต์", "การยึดเกาะของเซลล์" และ "กระบวนการแคแทบอลิซึมของยา" (ค่ามัธยฐานของการเปลี่ยนแปลง CN ในกลุ่มตัวอย่าง > = 1 สำหรับรายการทั้งหมดโปรดดูไฟล์เสริม 10) มีเพียงชุดย่อยของ 52 ยีน (0.6%) เท่านั้นที่แสดงจำนวนการคัดลอกยีนสูงบ่อยครั้งเพิ่มขึ้น (ค่ามัธยฐาน > = 4 ในทุกตัวอย่าง) เงื่อนไข GO ที่ได้รับการปรับปรุงส่วนใหญ่ซ้อนทับกับการเสริมแต่งของยีนรวมถึง CN ขนาดเล็กที่เพิ่มขึ้นพร้อมกับการเสริมสมรรถนะเพิ่มเติมของ "การตอบสนองต่อสายพันธุ์ออกซิเจนที่แอคทีฟ" (ไฟล์เสริม 10) หมวดหมู่เหล่านั้นอาจบ่งบอกถึงฟังก์ชันที่มีความกดดันในการเลือกบ่อยครั้งหรือรุนแรง จำนวนสำเนายีนค่ามัธยฐานมีความสัมพันธ์เชิงบวกระหว่างกลุ่ม (รูปที่ 8C, ความสัมพันธ์ของเพียร์สันสำหรับการเปรียบเทียบแบบคู่ระหว่าง 0.8 และ 0.91) แม้จะมีการเปลี่ยนแปลงอย่างกว้างขวางและการแปรผันของหมายเลขสำเนาที่ใช้ร่วมกันระหว่างกลุ่ม แต่หมายเลขสำเนาของยีนยังคงรักษาสัญญาณสายวิวัฒนาการไว้บางส่วน (รูปที่ 8D)
การแปล กรุณารอสักครู่..
