To examine the utility of noise reduction based on gap length, we filtered the full gap data matrix (12,030 characters of which 4,245 were parsimony informative) and excluded gap characters based on short (1- and 2-bp) indels. Removing 1-bp gaps reduced the matrix size by almost 25% (to 9,115 characters; 3,160 parsimony informative), whereas excluding both 1- and 2-bp gap characters reduced the matrix size by an additional 11% relative to the original matrix size (to 7,740 characters; 2,640 parsimony informative). Although the rate of longer gap accumulation was lower (the rate after excluding 1-bp gaps is 76% of that for the all gap matrix and the rate after excluding 1- and 2-bp gaps is 64%) all three data matrices exhibit similar levels of homoplasy (Table 2). Estimates of phylogeny obtained after removing short indels did not improve congruence with the nucleotide data tree (supplementary information, file 2). Robinson-Foulds distances [87] between the nucleotide trees and all of the gap trees ranged from 92 to 100, whereas the distance among gap trees ranged from 64 to 70. Removing short gaps may prove beneficial for other data sets, but these results showed that 1- and 2-bp gaps did not contribute substantially to the noise in the gap dataset.
การตรวจสอบของการลดเสียงรบกวนตามความยาวช่องว่าง เรากรองข้อมูลเมตริกซ์เต็มช่องว่าง (12,030 ตัวอักษรที่ 4,245 มีข้อมูล parsimony) และไม่รวมช่องว่างของอักขระตามระยะสั้น (1 - และ 2-bp) indels เอาช่องว่าง 1 bp ลดลงขนาดเมตริกซ์เกือบ 25% (เพื่อ 9,115 อักขระ parsimony ข้อมูล 3,160), ใน ขณะรวมทั้งอักขระช่องว่าง 1 - และ 2-bp ลดลงขนาดเมตริกซ์เพิ่ม 11% เมื่อเทียบกับขนาดเมตริกซ์เดิม (เพื่อ 7,740 อักขระ parsimony ข้อมูล 2,640) แม้ว่าอัตราการสะสมช่วงยาวต่ำ (อัตราหลังจากยกเว้นช่องว่าง 1 bp เป็น 76% ให้สำหรับช่องว่างทั้งหมด และอัตราหลังจากยกเว้นช่องว่าง 1 - และ 2-bp เป็น 64%) ข้อมูลสามเมทริกซ์แสดงคล้ายระดับ homoplasy (ตารางที่ 2) ประเมินของ phylogeny ที่ได้รับหลังจากเอาออก indels สั้นได้ปรับปรุงลงตัวกับแผนภูมิข้อมูลนิวคลีโอไทด์ (รายละเอียดเพิ่มเติม แฟ้ม 2) ระยะทางโรบินสัน Foulds [87] ระหว่างต้นไม้นิวคลีโอไทด์ทั้งหมดของช่องว่างของต้นไม้ที่อยู่ในช่วงจาก 92 100 ในขณะที่ระยะห่างระหว่างช่องว่างของต้นไม้อยู่ในช่วงจาก 64 ไป 70 เอาช่องว่างสั้น ๆ อาจพิสูจน์ประโยชน์สำหรับชุดข้อมูลอื่น ๆ แต่ผลเหล่านี้แสดงให้เห็นว่า ช่อง 1 - และ 2-bp ได้ไม่มีส่วนร่วมมากเสียงในช่องว่างของชุดข้อมูล
การแปล กรุณารอสักครู่..

เพื่อตรวจสอบยูทิลิตี้ของการลดเสียงรบกวนตามระยะเวลาที่ช่องว่างที่เรากรองช่องว่างเต็มรูปแบบเมทริกซ์ข้อมูล (12,030 ตัวละครที่มีความประหยัด 4,245 ข้อมูล) และตัวอักษรช่องว่างไม่รวมขึ้นอยู่กับระยะสั้น (1 และ 2 bp) indels การลบช่องว่าง 1 bp ลดขนาดเมทริกซ์โดยเกือบ 25% (ที่ 9,115 ตัวอักษร; 3,160 ตระหนี่ข้อมูล) ในขณะที่ไม่รวมทั้ง 1 และช่องว่าง 2 bp ตัวอักษรลดขนาดเมทริกซ์โดยเพิ่มเติมญาติ 11% ขนาดเมทริกซ์เดิม ( เพื่อ 7,740 ตัวอักษร; 2,640 ตระหนี่ข้อมูล) แม้ว่าอัตราการสะสมของช่องว่างอีกต่อไปลดลง (อัตราไม่รวมช่องว่าง 1 bp เป็น 76% ของที่เมทริกซ์ช่องว่างและอัตราการหัก 1 และช่องว่าง 2 bp เป็น 64%) การฝึกอบรมข้อมูลทั้งสามแสดงที่คล้ายกัน ระดับของ homoplasy (ตารางที่ 2) ประมาณการของเชื้อชาติที่ได้รับหลังจากที่ถอด indels สั้นไม่ดีขึ้นสอดคล้องกับต้นไม้ข้อมูลเบื่อหน่าย (ข้อมูลเพิ่มเติมยื่น 2) ระยะทางโรบินสัน Foulds [87] ระหว่างต้นไม้เบื่อหน่ายและทั้งหมดของต้นไม้ช่องว่างอยู่ในช่วง 92-100 ขณะที่ระยะท่ามกลางต้นไม้ช่องว่างตั้งแต่ 64 ถึง 70 ลบช่องว่างสั้นอาจพิสูจน์ประโยชน์สำหรับชุดข้อมูลอื่น ๆ แต่ผลลัพธ์เหล่านี้แสดงให้เห็นว่า ที่ 1 และช่องว่าง 2 bp ไม่ได้มีส่วนร่วมอย่างมากกับเสียงในชุดข้อมูลที่ทำให้เกิดช่องว่าง
การแปล กรุณารอสักครู่..
