To accurately assess variation in s

To accurately assess variation in selective pressure on the bowhead, minke,
and orca lineages in comparison to extant terrestrial mammals, we created
a protein-coding database spanning the placental mammals. Along with the
orca (http://www.ncbi.nlm.nih.gov/bioproject/189949), minke (Yim et al.,
2014), and bowhead data described above, we extracted protein coding
sequences from Ensembl Biomart v.73 (Flicek et al., 2013) for the following
18 genomes: chimpanzee, cow, dog, elephant, gibbon (5.63 coverage),
gorilla, guinea pig, horse, human, macaque, marmoset, microbat, mouse,
opossum, orangutan, platypus, rabbit, and rat. These genomes were all high
coverage (mostly >63 coverage) with the exception of gibbon (Supplemental
Folder 2). Sequence similarity searches were performed using mpi-BLAST
(v 1.6.0) (Altschul et al., 1990) (http://www.mpiblast.org/) on all proteins using
a threshold of 107
. Gene families were identified using in-house software that
clusters genes based on reciprocal BLAST hits (Altschul et al., 1990). We identified
a total of 6,630 gene families from which we extracted the single-gene
orthologous families (SGOs). Families were considered SGOs if we identified
a single-gene representative in each species (one-to-one orthologs), and to
account for lower coverage genomes and missing data we also considered
cases where a specific gene was not present in a species, i.e., one-to-zero orthology.
SGOs were only considered for subsequent analysis if they contained
more than seven species in total and if they contained no internal stop codons
(indicative of sequencing errors). In total, we retained 866 SGOs for further
analysis. Multiple sequence alignments (MSAs) were generated using default
parameters in PRANK (v.100802) (Lo¨ ytynoja and Goldman, 2008). To minimize
potential false-positives due to poor sequence quality, the MSAs of the 866
SGOs underwent strict data-quality filtering. The first filter prohibited the
presence of gaps in the MSA if created by unique insertions (>12 bp) in either
bowhead or minke sequences. The second filter required unaligned bowhead
or minke sequences to be at least half the length of their respective MSA.
These two filters refined the number of testable SGOs to 319. The gene phylogeny
of each SGO was inferred from the species phylogeny (Morgan et al.,
2013). CodeML from the PAML software package (v.4.4e) (Yang, 2007) was
employed for our selective pressure variation analyses. We analyzed each of
the 319 refined SGOs using the nested codon-based models of evolution under
a maximum likelihood framework. We employed the likelihood ratio test
(LRT) using nested models of sequence evolution to evaluate a variety of
models of codon sequence evolution (Yang, 2007). In general, these codon
models allow for variable dN/dS ratios (referred to as u throughout) among
sites in the alignment, along different lineages on our phylogenetic tree, or a
combination of both variations across lineages and sites. To assess the significance
of fit of each model to the data, we used the recommended LRTs
in CodeML (Yang, 2007) for comparing nested models (see Supplemental
Folder 2). The LRT test statistic approximates the chi-square (c2) distribution
critical value with degrees of freedom equal to the number of additional free
parameters in the alternative model. The goal of the codon-based modeling
is to determine the selective pressures at work in a lineage and site-specific
manner.
The models applied follow the standard nomenclature (i.e., model M1, M2,
A, and A null) (Yang, 2007). Model M1 assumes that there are two classes of
sites—those with an u value of zero and those with an u value of 1. Model
M2 allows for three classes of sites—one with an u value of zero, one with
an u value of one and one with an u value that is not fixed to any value. Given
the relationship between M1 and M2, they can be tested for the significance of
the difference of the fit of these two models using an LRT with df = 2. Finally, we
used model A that allows the u value to vary across sites and across different
lineages in combination. With model A, we can estimate the proportion of sites
and the dN/dS ratio in the foreground lineage of interest in comparison to the
background lineages and the estimated dN/dS ratio is free to vary above 1 (i.e.,
positive selection). Model A can be compared with its site-specific counterpart
(model M1) using the LRT with df = 2. In addition, the lineage and site-specific
model model A null was applied as a second LRT with model A. In model A null,
the additional site category is fixed at neutral rather than being estimated from
the data, and this LRT provides an additional test for model A (Zhang et al.,
2005). In this way, we performed independent tests on each of the extant cetacean
lineages (orca, minke, and bowhead), as well as testing each ancestral
cetacean branch (the MRCA of the two baleen whales and the MRCA of all
three cetaceans), to determine if there were signatures of positive selection
that are unique to each lineage (Yang and dos Reis, 2011). Using empirical
Bayesian estimations, we identified the specific residues that are positively
selected in each lineage tested. Positive selection was inferred if all of the
following criteria were met: (1) if the LRT was significant, (2) if the parameters
estimated under that model were concurrent with positive selection, and (3) if
the alignment in that region was of high quality (as judged by alignmenton completeness and quality in that region). The posterior probability (PP) of a
positively selected site is estimated using two calculations: Naive Empirical
Bayes (NEB) or Bayes Empirical Bayes (BEB) (Yang, 2007). If both NEB and
BEB are predicted, we reported the BEB results as they have been shown to
be more robust under certain conditions (Yang et al., 2005). For all models
used in the analysis where u is estimated from the data, a variety of starting
u values was used for the calculation of likelihood estimates. This ensures
that the global minimum is reached.

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

เพื่อประเมินการเปลี่ยนแปลงในความดันเลือก bowhead, minke อย่างถูกต้องและเชื้อชาติของตัว โดยเลี้ยงลูกด้วยนมภาคพื้นยัง ที่เราสร้างขึ้นโปรตีนรหัสฐานข้อมูลซึ่งประกอบไปด้วยเลี้ยงลูกด้วยนมรกลอก ตามด้วยการตัว (ส่วน http://www.ncbi.nlm.nih.gov/bioproject/189949) minke (ยิ้ม et al.,2014), และข้อมูล bowhead ข้าง เราสกัดโปรตีนรหัสจาก Ensembl Biomart v.73 (Flicek et al., 2013) ตามลำดับ18 genomes: ลิงชิมแปนซี วัว สุนัข ช้าง ชะนี (5.63 ครอบคลุม),กอริลล่า หนูตะเภา ม้า มนุษย์ macaque ตัว มาโมเสท microbat เมาส์โอพอสซัม อุรังอุตัง ตุ่นปากเป็ด กระต่าย และหนู Genomes เหล่านี้มีความสูงทั้งหมดความครอบคลุม (ส่วนใหญ่ > คลุม 63) ยกเว้นชะนี (Supplementalคุณ 2) ดำเนินการค้นหาความคล้ายคลึงกันของลำดับโดยใช้ระเบิด mpi(v 1.6.0) (Altschul et al., 1990) (ส่วน http://www.mpiblast.org/) ในโปรตีนทั้งหมดที่ใช้ขีดจำกัดของ 10 7. ครอบครัวยีนระบุใช้ซอฟต์แวร์ภายในที่กลุ่มยีนตามฮิตระเบิดซึ่งกันและกัน (Altschul และ al., 1990) เราระบุจำนวนครอบครัวยีน 6,630 ซึ่งเราได้แยกยีนเดียวครอบครัว orthologous (SGOs) ครอบครัวได้ถือ SGOs ถ้าเราระบุตัวแทนยีนเดียว ในแต่ละพันธุ์ (orthologs แบบหนึ่งต่อหนึ่ง), และgenomes ความครอบคลุมต่ำกว่าและขาดข้อมูลที่เราได้พิจารณากรณีที่ยีนที่เฉพาะเจาะจงไม่อยู่ในชนิด เช่น orthology หนึ่งเป็นศูนย์SGOs ได้เฉพาะถือสำหรับการวิเคราะห์ต่อ ๆ ไปถ้าพวกเขาอยู่มากกว่า 7 ชนิดรวมและถ้าพวกเขาอยู่ภายในไม่หยุด codons(ชี้ข้อผิดพลาดลำดับ) ทั้งหมด เราสะสม 866 SGOs สำหรับเพิ่มเติมวิเคราะห์ จัดลำดับการหลายแนว (MSAs) สร้างขึ้นโดยใช้เริ่มต้นพารามิเตอร์ในเล่นตลก (v.100802) (Lo¨ ytynoja และโกลด์แมน 2008) เพื่อลดเป็นเท็จทำงานผิดพลาดเนื่องจากลำดับต่ำคุณภาพ MSAs ของ 866SGOs รับการกรองข้อมูลคุณภาพอย่างเข้มงวด ตัวแรกที่ห้ามการของช่องว่างใน MSA ถ้าสร้าง โดยแทรกเฉพาะ (> 12 bp) ในลำดับ bowhead หรือ minke ตัวที่สองต้องไม่ bowheadหรือ minke ลำดับ น้อยครึ่งความยาวของ MSA ของพวกเขาเกี่ยวข้องตัวกรองเหล่านี้สองกลั่นจำนวน SGOs testable ไป 319 Phylogeny ยีนของแต่ละ SGO ถูกเอเชีย phylogeny พันธุ์ (มอร์แกน et al.,2013) ถูก CodeML จากแพคเกจซอฟต์แวร์ PAML (v.4.4e) (ยาง 2007)จ้างการวิเคราะห์ของเราเปลี่ยนแปลงความดันที่ใช้ เราวิเคราะห์แต่ละ319 การกลั่นใช้ซ้อนกันตามรหัสพันธุกรรมรูปแบบของวิวัฒนาการภายใต้ SGOsกรอบความเป็นไปได้สูงสุด เราจ้างทดสอบอัตราความเป็นไปได้(LRT) ใช้ซ้อนกันรูปแบบของวิวัฒนาการในลำดับการประเมินหลากหลายรูปแบบของวิวัฒนาการลำดับรหัสพันธุกรรม (ยาง 2007) โดยทั่วไป รหัสพันธุกรรมเหล่านี้รุ่นให้ dN dS ตัวแปรอัตราส่วน (เรียกว่า u ตลอด) ระหว่างในการจัดตำแหน่ง ตามเชื้อชาติที่แตกต่างกันในแผนภูมิของเรา phylogenetic หรือรวมทั้งความแตกต่างระหว่างเชื้อชาติและอเมริกา การประเมินความสำคัญพอดีของแต่ละรูปแบบข้อมูล เราใช้ LRTs แนะนำใน CodeML (ยาง 2007) การเปรียบเทียบรูปแบบซ้อนกัน (Supplemental ดูคุณ 2) สถิติทดสอบ LRT approximates กระจาย chi-square (c2)สำคัญค่าองศาความเป็นอิสระเท่ากับจำนวนเพิ่มเติมฟรีพารามิเตอร์ในแบบจำลองอื่น เป้าหมายของการสร้างโมเดลตามรหัสพันธุกรรมคือการ กำหนดความดันเลือกที่ทำงาน ในคนเชื้อสาย และไซต์ลักษณะการรูปแบบที่ใช้ตามระบบการตั้งชื่อมาตรฐาน (เช่น รุ่น M1, M2และเป็น null) (ยาง 2007) รุ่น M1 สมมติว่า มีสองประเภทอเมริกาซึ่งมีค่า u ของศูนย์และมีค่า u 1 แบบจำลองM2 ให้สามชั้นเรียนของอเมริกาซึ่งมีค่า u เป็นศูนย์ มีค่า u ของหนึ่งและมีค่า u ที่ไม่มีแก้ไขค่าใด ๆ กำหนดให้ความสัมพันธ์ระหว่าง M1 และ M2 พวกเขาสามารถทดสอบสำหรับความสำคัญของความแตกต่างของพอดีของโมเดลเหล่านี้สองด้วย LRT df = 2 สุดท้าย เราใช้แบบจำลองที่ช่วยให้ค่า u แตกต่างกันไป ทั่วอเมริกา และแตกต่างกันเชื้อชาติรวม ด้วยแบบจำลอง เราสามารถประเมินสัดส่วนของไซต์อัตราส่วน dN/dS ในลินเนจเบื้องหน้าน่าสนใจเปรียบเทียบและการเชื้อชาติของพื้นหลังและอัตราส่วน dN ประเมิน dS มีอิสระที่จะแตกต่างกันไปข้าง 1 (เช่นบวกการเลือก) รุ่น A สามารถเปรียบเทียบกับสำเนาของไซต์(รุ่น M1) ด้วย LRT df = 2 นอกจากนี้ ลินเนจ และเฉพาะใช้แบบจำลองแบบจำลอง A null เป็น LRT สองกับรุ่นอ. ในรุ่น nullหมวดหมู่เว็บไซต์เพิ่มเติมเป็นแบบคงที่เป็นกลางมากกว่าการประเมินจากข้อมูล และ LRT นี้มีการทดสอบเพิ่มเติมสำหรับรุ่น A (Zhang et al.,2005) ด้วยวิธีนี้ เราทำการทดสอบอิสระในแต่ละ cetacean ยังเชื้อชาติ (ตัว minke และ bowhead), ตลอดจนการทดสอบแต่ละโบราณสาขา cetacean (MRCA ของปลาวาฬ baleen สองและ MRCA ทั้งหมดสาม cetaceans), กำหนดถ้ามีลายเซ็นของตัวเลือกที่เป็นบวกที่เป็นลักษณะเฉพาะของแต่ละคนเชื้อสาย (ยางและ dos ใส่ 2011) ใช้ผลทฤษฎีประมาณ เราระบุตกเฉพาะที่เป็นบวกเลือกในคนเชื้อสายแต่ละทดสอบ เลือกค่าบวกถูกสรุปถ้าทั้งหมดของการตรงตามเงื่อนไขต่อไปนี้: (1) ถ้า LRT สำคัญ, (2) ถ้าพารามิเตอร์ประเมินภายใต้รูปแบบที่มีพร้อมกับเลือกบวก และ (3) ถ้าตำแหน่งในภูมิภาคที่มีคุณภาพสูง (เป็นตัดสิน โดย alignmenton เพื่อความสมบูรณ์และมีคุณภาพในภูมิภาคนั้น) ความหลัง (PP) ของการประมาณไซต์บวกเลือกใช้การคำนวณที่สอง: ประจักษ์ NaiveBayes (NEB) หรือประจักษ์ Bayes Bayes (BEB) (ยาง 2007) ถ้า NEB ทั้งสอง และBEB จะทำนาย เรารายงานผล BEB ว่าพวกเขาได้แสดงให้มีประสิทธิภาพมากขึ้นภายใต้เงื่อนไข (Yang et al., 2005) สำหรับทุกรุ่นใช้ในการวิเคราะห์ที่มีประเมินจากข้อมูล ความหลากหลายของการเริ่มต้น uค่า u ที่ใช้สำหรับการคำนวณการประเมินความเป็นไปได้ ให้แน่ใจว่า อย่างน้อยโลกถึง

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

ที่จะต้องประเมินการเปลี่ยนแปลงในความดันเลือกใน bowhead ที่มิงค์,
และ lineages
ปลาวาฬเพชรฆาตในการเปรียบเทียบกับเลี้ยงลูกด้วยนมที่ยังหลงเหลืออยู่ในโลกเราได้สร้างฐานข้อมูลการเข้ารหัสโปรตีนทอดเลี้ยงลูกด้วยนมรก พร้อมกับปลาวาฬเพชรฆาต (http://www.ncbi.nlm.nih.gov/bioproject/189949), มิงค์ (ยิ้ม et al., 2014) และข้อมูล bowhead อธิบายไว้ข้างต้นเราสกัดโปรตีนเข้ารหัสลำดับจากEnsembl Biomart โวลต์ 73 ต่อไปนี้ (Flicek et al, 2013). 18 จีโนม: ลิงชิมแปนซี, วัว, สุนัข, ช้าง, ชะนี (5.63 คุ้มครอง) กอริลลา, หนูตะเภาม้ามนุษย์ลิง, ลิง, microbat เมาส์หนูพันธุ์, ลิงอุรังอุตัง ตุ่นปากเป็ดกระต่ายและหนู เหล่านี้เป็นจีโนมทั้งหมดสูงคุ้มครอง (ส่วนใหญ่> 63 คุ้มครอง) มีข้อยกเว้นของชะนี (การเสริมโฟลเดอร์ 2) ค้นหาความคล้ายคลึงกันลำดับถูกดำเนินการโดยใช้ระเบิด-MPI (V 1.6.0) (Altschul et al., 1990) (http://www.mpiblast.org/) บนโปรตีนทั้งหมดโดยใช้เกณฑ์ของ10? 7 ยีนครอบครัวถูกระบุโดยใช้ซอฟแวร์ในบ้านที่กลุ่มที่ยีนที่อยู่บนพื้นฐานของการระเบิดซึ่งกันและกันฮิต (Altschul et al., 1990) เราระบุรวมเป็น 6,630 ครอบครัวยีนจากที่เราสกัดยีนเดียวครอบครัวorthologous (SGOs) ครอบครัวที่ได้รับการพิจารณา SGOs ถ้าเราระบุตัวแทนเดียวของยีนในแต่ละสายพันธุ์(หนึ่งต่อหนึ่ง orthologs) และการบัญชีสำหรับจีโนมของความคุ้มครองที่ลดลงและข้อมูลที่หายไปเรายังพิจารณากรณีที่ยีนที่เฉพาะเจาะจงไม่ได้อยู่ในสายพันธุ์คืออย่างใดอย่างหนึ่งเพื่อเป็นศูนย์ orthology. SGOs ได้รับการพิจารณาเฉพาะสำหรับการวิเคราะห์ที่ตามมาถ้าพวกเขามีมากกว่าเจ็ดชนิดรวมและถ้าพวกเขามีไม่หยุดcodons ภายใน(แสดงให้เห็นถึงข้อผิดพลาดลำดับ) โดยรวมแล้วเราเก็บไว้ 866 SGOs ต่อการวิเคราะห์ การจัดแนวลำดับหลาย (MSAs) ถูกสร้างขึ้นโดยใช้ค่าเริ่มต้นพารามิเตอร์ในPRANK (v.100802) (ytynoja แท้จริงและโกลด์แมน 2008) เพื่อลดศักยภาพบวกเท็จเนื่องจากคุณภาพลำดับยากจน MSAs ของ 866 SGOs เปลี่ยนกรองข้อมูลที่มีคุณภาพที่เข้มงวด ตัวกรองแรกที่ต้องห้ามการปรากฏตัวของช่องว่างใน MSA ถ้าสร้างขึ้นโดยการแทรกที่ไม่ซ้ำกัน (> 12 bp) ทั้งใน bowhead หรือลำดับมิงค์ ตัวกรองที่สองต้อง unaligned bowhead หรือมิงค์ลำดับเป็นอย่างน้อยครึ่งหนึ่งของความยาวของตน MSA. เหล่านี้สองตัวกรองกลั่นจำนวน SGOs ทดสอบเพื่อ 319 เชื้อชาติยีนของแต่ละSGO ได้รับการสรุปจากเชื้อชาติสายพันธุ์ (มอร์แกน, et al , 2013) CodeML จากแพคเกจซอฟต์แวร์ PAML (v.4.4e) (Yang, 2007) ถูกใช้สำหรับการเปลี่ยนแปลงความดันเลือกของเราจะวิเคราะห์ เราวิเคราะห์แต่ละ319 SGOs กลั่นโดยใช้รูปแบบตาม codon ที่ซ้อนกันของวิวัฒนาการภายใต้กรอบความน่าจะเป็นสูงสุด เรามีงานทำการทดสอบความน่าจะเป็นอัตราส่วน(LRT) โดยใช้แบบจำลองที่ซ้อนกันของวิวัฒนาการตามลำดับในการประเมินความหลากหลายของรูปแบบของการวิวัฒนาการลำดับcodon (Yang, 2007) โดยทั่วไป codon เหล่านี้รุ่นอนุญาตให้มีอัตราส่วนตัวแปรDN / DS (เรียกว่ายูตลอด) ในหมู่เว็บไซต์ในการจัดตำแหน่งพร้อมlineages ที่แตกต่างกันบนต้นไม้สายวิวัฒนาการของเราหรือการรวมกันของทั้งสองรูปแบบทั่วlineages และเว็บไซต์ เพื่อประเมินความสำคัญของความพอดีของแต่ละรุ่นกับข้อมูลที่เราใช้ LRTs แนะนำในCodeML (Yang, 2007) สำหรับการเปรียบเทียบรูปแบบที่ซ้อนกัน (ดูเพิ่มเติมโฟลเดอร์2) สถิติการทดสอบ LRT ใกล้เคียงกับไคสแควร์ (c2) การกระจายค่าที่สำคัญที่มีองศาอิสระเท่ากับจำนวนของฟรีเพิ่มเติมพารามิเตอร์ในรูปแบบทางเลือก เป้าหมายของการสร้างแบบจำลอง codon ตามที่คือการกำหนดแรงกดดันเลือกที่ทำงานอยู่ในสายเลือดและเว็บไซต์ที่เฉพาะเจาะจงอย่าง. รุ่นที่ใช้ตามศัพท์มาตรฐาน (เช่นรุ่น M1, M2, และ null) (Yang, 2007 ) รุ่น M1 สมมติว่ามีสองชั้นของเว็บไซต์เหล่านั้นมีมูลค่ายูของศูนย์และผู้ที่มีค่าของท่าน1. รุ่นM2 ช่วยให้สามชั้นเรียนของเว็บไซต์หนึ่งที่มีค่าของท่านเป็นศูนย์หนึ่งที่มีค่าของท่านอย่างใดอย่างหนึ่งและเป็นหนึ่งที่มีค่ายูที่ไม่ได้รับการแก้ไขเพื่อให้มีค่าใด ๆ ได้รับความสัมพันธ์ระหว่าง M1 และ M2 ที่พวกเขาสามารถได้รับการทดสอบสำหรับความสำคัญของความแตกต่างของความพอดีของทั้งสองรุ่นใช้LRT กับที่สั่ง df = 2 สุดท้ายเราใช้รูปแบบที่ช่วยให้ยูค่าที่แตกต่างกันในเว็บไซต์และข้ามที่แตกต่างกันlineages ในการรวมกัน ด้วยรูปแบบที่เราสามารถประมาณการสัดส่วนของเว็บไซต์และ DN / อัตราส่วน dS ในวงศ์เบื้องหน้าที่น่าสนใจในการเปรียบเทียบกับ lineages พื้นหลังและอัตราส่วนประมาณ DN / DS มีอิสระที่จะแตกต่างกันดังกล่าวข้างต้น 1 (เช่นเลือกบวก) รุ่น A สามารถนำมาเปรียบเทียบกับคู่ของเว็บไซต์ที่เฉพาะเจาะจงของ(รุ่น M1) โดยใช้ LRT กับ DF = 2. นอกจากนี้เชื้อสายและเว็บไซต์ที่เฉพาะเจาะจงรูปแบบรูปแบบโมฆะถูกนำมาใช้เป็นLRT ที่สองกับเอรูปแบบในรูปแบบโมฆะ , หมวดหมู่เว็บไซต์เพิ่มเติมคงที่เป็นกลางมากกว่าการประเมินจากข้อมูลและ LRT นี้ให้การทดสอบเพิ่มเติมสำหรับรุ่น A (Zhang et al., 2005) ด้วยวิธีนี้เราทำการทดสอบอิสระในแต่ละปลาวาฬที่ยังหลงเหลืออยู่lineages (ปลาวาฬเพชรฆาต, มิงค์และ bowhead) เช่นเดียวกับการทดสอบแต่ละบรรพบุรุษสาขาปลาวาฬ(คน MRCA ของทั้งสองปลาวาฬพบปะและ MRCA ของทุกสามcetaceans) เพื่อ ตรวจสอบว่ามีลายเซ็นของการเลือกในเชิงบวกที่เป็นเอกลักษณ์ของแต่ละเชื้อสาย(ยางและ dos Reis 2011) ใช้เชิงประจักษ์ประมาณการคชกรรมเราระบุตกค้างเฉพาะที่มีการบวกเลือกในสายเลือดแต่ละการทดสอบ เลือกบวกได้สรุปถ้าทั้งหมดของเกณฑ์ต่อไปนี้ได้พบกับ (1) ถ้า LRT อย่างมีนัยสำคัญ (2) ถ้าพารามิเตอร์ที่ประมาณภายใต้รูปแบบที่มีความพร้อมกันกับการเลือกในเชิงบวกและ(3) ในกรณีที่การจัดตำแหน่งในพื้นที่ที่เป็นของที่มีคุณภาพสูง (ตามที่ตัดสินโดยครบถ้วน alignmenton และคุณภาพในภูมิภาคนั้น) ความน่าจะเป็นหลัง (PP) ของเว็บไซต์ที่เลือกบวกประมาณโดยวิธีการคำนวณที่สอง: หน่อมแน้มเชิงประจักษ์เบส์ (NEB) หรือเบส์เชิงประจักษ์เบส์ (BEB) (Yang, 2007) หากทั้งสอง NEB และBEB ที่คาดว่าเรารายงานผลการ BEB ที่พวกเขาได้รับการแสดงที่จะมีประสิทธิภาพมากขึ้นภายใต้เงื่อนไขบาง(Yang et al., 2005) สำหรับทุกรุ่นที่ใช้ในการวิเคราะห์ที่ u เป็นที่คาดจากข้อมูลที่มีความหลากหลายของการเริ่มต้นค่ายูถูกนำมาใช้ในการคำนวณประมาณการโอกาส เพื่อให้แน่ใจว่าขั้นต่ำทั่วโลกจะมาถึง

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

จะต้องประเมินการเปลี่ยนแปลงในความดันที่ใช้ใน bowhead มิงก์
, , และเมื่อเปรียบเทียบกับ Orca ยังบกสัตว์เลี้ยงลูกด้วยนม เราสร้างฐานข้อมูล
โปรตีนซึ่งสัตว์เลี้ยงลูกด้วยนมคนไทยนะครับ พร้อมกับ
ปลาวาฬ ( http : / / www.ncbi . nlm . NIH . gov / bioproject / 189949 ) มิงก์ ( ยิม et al . ,
2014 ) และ bowhead ข้อมูลที่อธิบายไว้ข้างต้นเราได้นะครับ
ensembl ลำดับจากโปรตีน biomart โวลต์73 ( flicek et al . , 2013 ) สำหรับ 18 จีโนมต่อไปนี้
: ลิงชิมแปนซี วัว สุนัข ช้าง ชะนี ( 5.63 ครอบคลุม ) ,
กอริลลา , หนูตะเภา , ม้า , มนุษย์ , ลิงมาโมเสท , ,
microbat , เมาส์ , โอพอสซั่มอุรังอุตัง , ตุ่นปากเป็ด , กระต่ายและหนู หาเหล่านี้ทั้งหมดสูง
ครอบคลุม ( ส่วนใหญ่ > 63 ครอบคลุม ) ด้วยข้อยกเว้นของชะนี ( โฟลเดอร์เพิ่มเติม
2 )ค้นหาความเหมือนลำดับการใช้ MPI ระเบิด
( ( 08 ) ( แอลเชิล et al . , 1990 ) ( http://www.mpiblast.org/ ) ต่อโปรตีนทั้งหมด โดยใช้เกณฑ์ของ 10
7
ยีนครอบครัวถูกระบุใช้ในซอฟต์แวร์ที่
กลุ่มยีนตามแบบฮิตระเบิด ( แอลเชิล et al . , 1990 ) เราระบุ
รวม 6630 ครอบครัวยีนที่เราสกัด
ยีนเดี่ยวครอบครัว orthologous ( sgos ) ครอบครัว ถือว่าเป็น sgos ถ้าเราระบุ
ตัวแทนยีนเดียวในแต่ละชนิด ( แบบ orthologs ) และบัญชีเพื่อลดความคุ้มครอง

หาข้อมูลที่หายไปและเรายังถือว่า
กรณีที่ยีนที่เฉพาะเจาะจงไม่ได้อยู่ในสายพันธุ์ เช่น หนึ่งศูนย์ orthology .
sgos เป็นเพียงการพิจารณาการวิเคราะห์ที่ตามมาถ้าพวกเขา ที่มีอยู่
กว่าเจ็ดชนิดในทั้งหมดและถ้าพวกเขามีไม่มีซิสหยุดภายใน
( อาการของข้อผิดพลาดลำดับ ) โดยรวมเรายังคงตาม sgos สำหรับการวิเคราะห์ต่อไป

การลำดับหลาย ( มซาส ) ถูกสร้างขึ้นโดยใช้พารามิเตอร์เริ่มต้น
ในเล่นตลก ( v.100802 ) ( โลตั้ง ytynoja และโกลด์แมน , 2008 ) เพื่อลด
บวกเท็จที่มีศักยภาพเนื่องจากคุณภาพลำดับไม่ดี , 866
มซาสในsgos ได้รับเข้มงวดคุณภาพข้อมูลการกรอง ตัวกลั่นกรองแรก ห้าม
ที่มีช่องว่างใน MSA โดยเฉพาะถ้าสร้างใหม่ ( 12 bp ) เหมือนกัน
bowhead หรือมิงก์ ลำดับ ตัวกรองที่สองต้อง unaligned bowhead
หรือมิงก์ดังนี้เป็นอย่างน้อยครึ่งหนึ่งของความยาวของ MSA ของตน .
2 ตัวกรองกลั่นจำนวนทดสอบได้ sgos เพื่อคุณ . ระบบเชื้อชาติ
ยีนของแต่ละ SGO มีทั้งชนิดระบบเชื้อชาติ ( มอร์แกน et al . ,
2013 ) codeml จาก paml แพคเกจซอฟต์แวร์ ( v.4.4e ) ( Yang , 2007 ) คือ
ในการวิเคราะห์ของเราดันเลือกวิธี เราวิเคราะห์กัน
sgos 319 กลั่นโดยใช้รหัสซ้อนตามรูปแบบของวิวัฒนาการภายใต้
กรอบอันดับสูงสุด เราใช้โอกาสทดสอบอัตราส่วน
( LRT ) โดยใช้รูปแบบของวิวัฒนาการลำดับซ้อนกันเพื่อประเมินความหลากหลายของรูปแบบของวิวัฒนาการลำดับ codon
( Yang , 2007 ) โดยทั่วไปรูปแบบ codon
เหล่านี้อนุญาตให้อัตราส่วน DN / DS ตัวแปร ( เรียกว่า U ตลอด ) ระหว่าง
เว็บไซต์ในการจัดแนวตามเผ่าพันธุ์ที่แตกต่างกันบน phylogenetic ต้นไม้ของเรา , หรือการรวมกันของทั้งสองรูปแบบเว็บไซต์
ข้ามเชื้อชาติและ . เพื่อประเมินความสำคัญ
พอดีของแต่ละโมเดลกับข้อมูลที่เราเคยแนะนำ lrts
ใน codeml ( Yang , 2007 ) สำหรับการเปรียบเทียบโมเดลที่ซ้อนกันอยู่ ( ดูโฟลเดอร์เพิ่มเติม
2 ) สถิติทดสอบไคสแควร์กับ LRT ( C2 ) กระจาย
ค่าวิกฤตที่มีองศาเสรีเท่ากับจำนวนเพิ่มเติมฟรี
พารามิเตอร์ในรูปแบบทางเลือก เป้าหมายของการใช้แบบจำลอง
โคดอนคือการ ระบุว่า แรงกดดันที่เลือกทำงานในสายเลือดและลักษณะเฉพาะ
.
แบบประยุกต์ตามระบบมาตรฐาน ( เช่น รุ่น M1 M2
, และ null ) ( Yang , 2007 ) รุ่น M1 ถือว่ามีสองชั้นเรียนของ
เว็บไซต์เหล่านั้นที่มีค่า U ของศูนย์และผู้ที่มีคุณค่าของ 1 แบบจำลอง
m2 ให้สามประเภทของเว็บไซต์หนึ่งที่มีคุณค่าของศูนย์ กับ
เป็นค่า U ของหนึ่งและหนึ่งที่มีค่า U ที่ไม่คงที่ใด ๆค่า ให้
ความสัมพันธ์ระหว่าง M1 และ M2 ก็สามารถทดสอบนัยสำคัญของความแตกต่างของ
พอดี ทั้งสองรุ่นใช้ LRT กับ df = 2 สุดท้ายเรา
ใช้แบบจำลองที่อนุญาตให้คุณมูลค่าแตกต่างกันไปในเว็บไซต์และข้ามเชื้อชาติที่แตกต่างกัน
ในการรวมกัน แบบ Aเราสามารถประเมินสัดส่วนของเว็บไซต์
และ DN / DS อัตราส่วนในเบื้องหน้า เชื้อสายของความสนใจในพื้นหลังเมื่อเปรียบเทียบกับ
และคาดว่าอัตราส่วน DN / DS ฟรีแตกต่างกันข้างต้น 1 ( เช่น
บวกเลือก ) แบบจำลองสามารถเปรียบเทียบกับ
คู่ของเฉพาะ ( รุ่น 1 ) โดยใช้ LRT กับ df = 2 นอกจากนี้ สายเลือดและเฉพาะ
โมเดลเป็น null คือใช้เป็นสองแบบ 1 . แบบ LRT เป็น null
หมวดหมู่เว็บไซต์เพิ่มเติมที่เป็นกลางมากกว่าถูกประเมินจาก
ข้อมูลนี้และให้ทดสอบเพิ่มเติมสำหรับ LRT โมเดล ( Zhang et al . ,
2005 ) วิธีนี้เราดำเนินการทดสอบอิสระของแต่ละเผ่าพันธุ์ปลาวาฬ
เท่าที่มีอยู่ ( orca มิงก์ และ bowhead ) ตลอดจนการทดสอบแต่ละบรรพบุรุษ
สาขาปลาวาฬ ( mrca ของทั้งสองบาลีนปลาวาฬและ mrca เลย
3 สัตว์น้ำเลี้ยงลูกด้วยนม ) เพื่อตรวจสอบว่ามีลายเซ็นของบวกเลือก
ที่เป็นเอกลักษณ์ของแต่ละวงศ์ ( หยางและ Dos Reis , 2011 ) การใช้ข้อมูลเชิงประจักษ์
คชกรรมการเราระบุเฉพาะตกค้างที่บวก
เลือกในแต่ละการทดสอบ สรุป ถ้าเลือกบวกทั้งหมดของ
เกณฑ์ต่อไปนี้ที่พบ : ( 1 ) หาก LRT อย่างมีนัยสำคัญทางสถิติ ( 2 ) ถ้าค่า
ประมาณตามรูปแบบที่สอดคล้องกับการเลือกที่เป็นบวก และ ( 3 ) ถ้าแนวเขต
ที่คุณภาพสูง ( ตัดสินโดย alignmenton ครบถ้วนและคุณภาพในภูมิภาค ) น่าจะเป็นด้านหลัง ( PP ) ของทางเว็บไซต์เป็นวิธีเลือก

2 : ไร้เดียงสาเชิงคำนวณเบส์ ( Bayes Bayes เอ็น ) หรือเชิงประจักษ์ ( เบ๊บ ) ( Yang , 2007 ) ถ้าทั้งสองด้านและ
เบ๊บจะคาดการณ์ เรารายงานเบ๊บผลลัพธ์จะถูกแสดง

จะมีเสถียรภาพมากขึ้น ภายใต้เงื่อนไขบางอย่าง ( หยาง et al . , 2005 ) สำหรับทุกรุ่นที่ใช้ในการวิเคราะห์ที่ u
( จากข้อมูลที่หลากหลายตั้งแต่
u ค่าถูกใช้เพื่อคำนวณความน่าจะเป็นประมาณ นี้มั่นใจ
ที่สุดทั่วโลกถึง

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.