2.1. Multiple sequence alignments and selection of representative
sequences
The genome sequence of O. sativa ssp. japonica cv. Nipponbare
(IRGSP build 4) (International Rice Genome Sequencing Project,2005) was retrieved from http://rapdb.dna.affrc.go.jp, and that of O.
sativa ssp. indica cv. 93-11 (BGI-RIS assembly) (Yu et al., 2002) was
retrieved from http://rice.genomics.org.cn/rice/index2.jsp. The
FLcDNA sequences from O. rufipogon W1943 were downloaded from
http://202.127.18.228/ricd/dym/ftp.php (Lu et al., 2008). RepeatMasker
(http://www.repeatmasker.org/) and the MIPS repeat element
database were used to mask repetitive sequences. In addition, vector
sequences and poly-A stretches were removed using custom-made
Perl scriptsEST2genome, the modified version of EST_GENOME (Mott, 1997),
was used to map the trimmed FLcDNA sequences to the japonica and
indica genomes using the criteria of 80% identity and 80% coverage. If a
sequence could be mapped to multiple chromosomal positions, only
one mapping position was selected in the order of identity, coverage,
number of exons, and the chromosomal position closest to the 5′-end.
If an FLcDNA sequence was mapped to both the japonica and indica
genomes, a multiple sequence alignment of the FLcDNA and its
corresponding genomic sequences in japonica and indica was
generated using ClustalW (Larkin et al., 2007). The positions of the
coding and non-coding regions were transferred from the O. sativa
ssp. japonica genome, which was annotated by the Rice Annotation
Project (RAP) (Itoh et al., 2007; Tanaka et al., 2008), to the mapped O.
rufipogon FLcDNAs and O. sativa ssp. indica genomic sequence. If there
were alternative variants of japonica, only the representative exon–
intron structure selected by RAP was used. Multiple alignments that
contained ambiguous nucleotides (N) in the sequences from any of
the three species were removed from our data set. To avoid possible
frame-shift errors, alignments that included indels in the coding
regions were removed. In addition, to exclude paralogous sequences,
the alignments were also removed if a japonica genomic sequence
could be mapped to another locus within the indica genome with a
greater identity than that for the indica locus of the alignment under
examination, and vice versa. Lastly, if multiple O. rufipogon FLcDNAs
were mapped to the same genomic region, only one representative
alignment was selected, in the order of coverage and length.
2.1 การจัดแนวหลายลำดับและการเลือกตัวแทน
ลำดับลำดับจีโนมของ o sativa เอสเอส จาปอพันธุ์ Nipponbare
(irgsp สร้าง 4) (ข้าวโครงการลำดับจีโนมระหว่างประเทศ 2005) ได้รับการเรียกข้อมูลจาก http://rapdb.dna.affrc.go.jp และของ o.
sativa เอสเอส indica พันธุ์ 93-11 (BGI-RIS ประกอบ) (yu, et al., 2002) เป็น
เรียกข้อมูลจาก http://rice.genomics.org.cn/rice/index2jsp ที่
ลำดับ flcdna จาก o rufipogon w1943 ถูกดาวน์โหลดจาก
http://202.127.18.228/ricd/dym/ftp.php (lu และคณะ. 2008) repeatmasker
(http://www.repeatmasker.org/) และ mips องค์ประกอบซ้ำ
ฐานข้อมูลถูกนำมาใช้เพื่อหน้ากากลำดับซ้ำ นอกจากนี้เวกเตอร์
ลำดับและโพลีเหยียดถูกถอดออกมาใช้ทำเอง
scriptsest2genome ของ Perl, รุ่นที่ปรับเปลี่ยน est_genome (Mott,1997)
ถูกใช้ในการแมปลำดับ flcdna ลดถึงจาปอและ
indica จีโนมโดยใช้เกณฑ์ของตัว 80% และความคุ้มครอง 80% ถ้า
ลำดับจะได้รับการแมปไปยังตำแหน่งของโครโมโซมหลายตำแหน่งการทำแผนที่เพียง
หนึ่งได้รับเลือกในการสั่งซื้อของเอกลักษณ์ความคุ้มครอง
จำนวน exons และตำแหน่งของโครโมโซมที่ใกล้เคียงที่สุดที่จะ 5'-end.
ถ้าลำดับ flcdna ถูกแมปไปยังทั้งสอง japonica และ indica
จีโนม, ลำดับการจัดเรียงหลาย flcdna และลำดับจีโนม
ที่สอดคล้องกันใน japonica และ indica ถูกสร้างขึ้นโดยใช้
ClustalW (เฟร็ดดี้และคณะ. 2007) ตำแหน่งของ
เข้ารหัสและไม่เข้ารหัสภูมิภาคถูกย้ายจาก o sativa
เอสเอส จีโนมจาปอซึ่งเป็นข้อเขียนโดยบันทึกย่อข้าว
(. Itoh et al, 2007. ทานากะ, et al, 2008) โครงการ (การลงโทษ). เพื่อแมป o
flcdnas rufipogon และ o sativa เอสเอส ลำดับจีโนม indica ถ้ามี
เป็นพันธุ์ทางเลือกของการจาปอเท่านั้นที่โครงสร้างเอกซ์ซอน-
intron ตัวแทนเลือกโดยการลงโทษถูกนำมาใช้ การจัดแนวหลายตัวที่มีนิวคลีโอ
คลุมเครือ (n) ในลำดับจากทุก
สามชนิดที่ถูกถอดออกจากชุดข้อมูลของเราเพื่อหลีกเลี่ยงข้อผิดพลาดที่เป็นไปได้
กรอบเปลี่ยนการจัดแนวที่รวม indels ในการเข้ารหัส
ภูมิภาคที่ถูกถอดออก นอกจากนี้จะไม่รวมลำดับ paralogous
การจัดแนวที่ถูกลบออกถ้ายังลำดับจีโนมจาปอ
สามารถแมปไปยังสถานทีอื่นในจีโนม indica ด้วยเอกลักษณ์
มากกว่าว่าสำหรับสถานที indica ของการจัดตำแหน่งที่อยู่ภายใต้การตรวจสอบ
, และรอง ในทางกลับกัน สุดท้ายถ้า o หลาย flcdnas rufipogon
ถูกแมปไปยังภูมิภาคจีโนมที่เหมือนกันเพียงหนึ่งตัวแทน
จัดตำแหน่งที่ได้รับเลือกในการสั่งซื้อของความคุ้มครองและระยะเวลาใน
การแปล กรุณารอสักครู่..
2.1 จัดแนวลำดับและเลือกตัวแทนหลาย
ลำดับ
ลำดับกลุ่มของพันธุ์ japonica ssp. ซา O. Nipponbare
(IRGSP build 4) (นานาจีโนมลำดับเบสโครงการข้าว 2005) ถูกดึงจาก http://rapdb.dna.affrc.go.jp และที่โอ
ซา ssp. indica พันธุ์ 93-11 (BGI RIS ประกอบ) (Yu et al., 2002) ได้
เรียกจาก http://rice.genomics.org.cn/rice/index2สาทร ใน
ดาวน์โหลดจาก FLcDNA ลำดับจาก O. rufipogon W1943
http://202.127.18.228/ricd/dym/ftp.php (Lu et al., 2008) RepeatMasker
(http://www.repeatmasker.org/) และ MIPS ทำซ้ำองค์ประกอบ
ฐานข้อมูลใช้หน้ากากลำดับซ้ำ นอกจากนี้ เวกเตอร์
ลำดับและโพลี-A เหยียดออกใช้ทำเอง
ภาษาเพิร์ล scriptsEST2genome รุ่น EST_GENOME (อาร์มอตต์ แก้ไข 1997),
ใช้แมปลำดับ FLcDNA ถูกตัดออกไป japonica และ
genomes indica โดยใช้เกณฑ์ 80% ตัวตนและความครอบคลุม 80% ถ้าเป็น
ลำดับอาจถูกแมปกับหลายของโครโมโซมตำแหน่ง เฉพาะ
เลือกหนึ่งการแม็ปตำแหน่งลำดับรหัสประจำตัว ครอบคลุม,
จำนวน exons และสุดท้าย 5′ ตำแหน่งของโครโมโซมได้
ถ้าลำดับการ FLcDNA ถูกแมปกับ japonica และ indica
genomes แบบจัดลำดับหลายของ FLcDNA และ
ตรง genomic ลำดับใน japonica และ indica ถูก
โดย ClustalW (Larkin et al., 2007) ตำแหน่งของการ
รหัส และ รหัสไม่ถูกโอนย้ายมาจากซา O.
ssp. japonica จีโนม ที่ใส่คำอธิบายประกอบ ด้วยคำอธิบายข้าว
โครงการ (RAP) (อิโตะเอ็ด al., 2007 ทานากะ et al., 2008), การโอแมป
rufipogon FLcDNAs และโอซา ssp. indica genomic ลำดับนั้น ถ้ามี
ถูกย่อยอื่นของ japonica เฉพาะพนักงาน exon–
ใช้โครงสร้าง intron เลือก โดย RAP จัดแนวหลายที่
ประกอบด้วยนิวคลีโอไทด์ไม่ชัดเจน (N) ในลำดับจาก
ชนิดสามออกจากชุดข้อมูลของเรา เพื่อหลีกเลี่ยงการสุด
เฟรมกะข้อผิดพลาด การจัดแนวที่ indels ในรหัส
ออกภูมิภาค นอกจากนี้ การแยกลำดับ paralogous,
จัดแนวที่ได้ถูกเอาออกถ้าลำดับ genomic japonica
อาจแม็ปกับโลกัสโพลอื่นภายในจีโนม indica กับการ
เอกลักษณ์มากขึ้นกว่าในโลกัสโพล indica ของตำแหน่งภายใต้
สอบ และในทางกลับกันได้ สุดท้าย ถ้าหลาย O. rufipogon FLcDNAs
ถูกแมปกับภูมิภาค genomic เดียวกัน ตัวแทนเดียว
ตำแหน่งเลือก กับความครอบคลุมและความยาว
การแปล กรุณารอสักครู่..