GBS accesses regulatory regions and sequence tag mapping requires no reference genome
As more information is gathered, it is becoming apparent that regulatory regions controlling the expression of plant genes responsible for agronomically important phenotypes are often located in non-coding DNA. For example, regulatory regions of maize genes vgt1 [35], tb1 [36] and b1 [37] are located 60 to 150 kb from the structural gene. Therefore, systematic discovery and mapping of genetic diversity should not be limited to coding regions. In this sense, the GBS procedure allows access to any sequence within “low-copy” genomic regions, including transposable elements and repeat regions that have not proliferated extensively.
Another advantage to the GBS approach is that a reference genome need only be developed neighboring the restriction sites, and this can be done in the process of sample genotyping. In such cases, the consensus of the read clusters across the sequence tagged sites becomes the reference. Alternatively, for kinship analyses and genomic selection in the absence of a reference genome, the tags can simply be treated as dominant markers. While not addressed here, there has also been tremendous progress in the imputation of missing data. In biparental mapping populations of species with a reference genome, this can be done with extremely high accuracy [5], and even in more diverse material, imputation accuracies over 99% permit low coverage. In the case of maize, we envision performing whole genome sequencing on a few thousand lines and then projecting their polymorphisms onto hundreds of thousands of additional lines via GBS and imputation.
We have shown that for an expenditure of $8,000 (USD), approximately 200,000 maize markers can be identified and mapped in a very short time. With the methods outlined here, we can process 336–672 samples (48 or 96 samples per channel ×7 channels per flow cell) simultaneously. Multiplexes up to 384 per lane (2,688 samples per sequencing run) are becoming possible as read density improves on sequencers. The economy of scale associated with these improvements is rapidly pushing genotyping below $20 per sample. Projected gains in the near future could result in a further four to five fold reduction to $5 or less per sample. Soon, plant breeders may conduct genomic selection on a novel germplasm or species without first having to develop any prior molecular tools, or conservation biologists may determine population structure without prior knowledge of the genome or diversity in the species. These exciting new avenues for applying GBS to breeding, conservation, and global species and population surveys are now poised to become an indispensable component of future biology.
GBS เข้าถึงภูมิภาคระเบียบ และลำดับการแม็ปป้ายต้องไม่มีกลุ่มอ้างอิงเป็นรวบรวมข้อมูลเพิ่มเติม มันเป็นที่ภูมิภาคกำกับดูแลการควบคุมค่าของพืชยีนฟี agronomically สำคัญมักอยู่ในดีเอ็นเอไม่ใช่โค้ดชัดเจน ตัวอย่าง ทางภูมิภาคของยีนข้าวโพด vgt1 [35], tb1 [36] และ b1 [37] จะอยู่ 60-150 kb จากยีนโครงสร้าง ดังนั้น ระบบค้นหาและการแม็ปของความหลากหลายทางพันธุกรรมไม่ควรจำกัดขอบเขตในการเขียนโค้ด ในนี้รู้สึก กระบวนการ GBS ได้ถึงลำดับใดภายในภูมิภาค genomic "ต่ำสำเนา" รวมทั้งองค์ประกอบ transposable และภูมิภาคซ้ำที่มีไม่ proliferated อย่างกว้างขวางประโยชน์อื่นวิธี GBS คือ กลุ่มอ้างอิงต้องสามารถพัฒนาใกล้เคียงอเมริกาจำกัด และนี้สามารถทำได้ระหว่างตัวอย่าง genotyping ในกรณี มติของคลัสเตอร์อ่านข้ามไซต์ลำดับที่แท็กกลายเป็น การอ้างอิง หรือ ร่วมวิเคราะห์และเลือก genomic ในการขาดงานของกลุ่มอ้างอิง แท็กสามารถเพียงเป็นเครื่องหมายหลักการ ขณะไม่อยู่ที่นี่ ยังมีความคืบหน้าอย่างมากใน imputation ของข้อมูลสูญหาย ในประชากรการแม็ป biparental พันธุ์กับกลุ่มอ้างอิง ซึ่งสามารถทำได้ ด้วยความแม่นยำสูงมาก [5], และแม้แต่ในวัสดุที่มีความหลากหลายมากขึ้น imputation accuracies กว่า 99% ความครอบคลุมต่ำสุดที่อนุญาตให้ ในกรณีของข้าวโพด ที่เราวาดภาพทำทั้งจีโนมลำดับบรรทัดกี่พันแล้ว projecting polymorphisms ของพวกเขาไปยังหลายร้อยหลายพันบรรทัดเพิ่มเติมผ่านทาง imputation และ GBSWe have shown that for an expenditure of $8,000 (USD), approximately 200,000 maize markers can be identified and mapped in a very short time. With the methods outlined here, we can process 336–672 samples (48 or 96 samples per channel ×7 channels per flow cell) simultaneously. Multiplexes up to 384 per lane (2,688 samples per sequencing run) are becoming possible as read density improves on sequencers. The economy of scale associated with these improvements is rapidly pushing genotyping below $20 per sample. Projected gains in the near future could result in a further four to five fold reduction to $5 or less per sample. Soon, plant breeders may conduct genomic selection on a novel germplasm or species without first having to develop any prior molecular tools, or conservation biologists may determine population structure without prior knowledge of the genome or diversity in the species. These exciting new avenues for applying GBS to breeding, conservation, and global species and population surveys are now poised to become an indispensable component of future biology.
การแปล กรุณารอสักครู่..
