To accurately assess variation in selective pressure on the bowhead, minke,
and orca lineages in comparison to extant terrestrial mammals, we created
a protein-coding database spanning the placental mammals. Along with the
orca (http://www.ncbi.nlm.nih.gov/bioproject/189949), minke (Yim et al.,
2014), and bowhead data described above, we extracted protein coding
sequences from Ensembl Biomart v.73 (Flicek et al., 2013) for the following
18 genomes: chimpanzee, cow, dog, elephant, gibbon (5.63 coverage),
gorilla, guinea pig, horse, human, macaque, marmoset, microbat, mouse,
opossum, orangutan, platypus, rabbit, and rat. These genomes were all high
coverage (mostly >63 coverage) with the exception of gibbon (Supplemental
Folder 2). Sequence similarity searches were performed using mpi-BLAST
(v 1.6.0) (Altschul et al., 1990) (http://www.mpiblast.org/) on all proteins using
a threshold of 107
. Gene families were identified using in-house software that
clusters genes based on reciprocal BLAST hits (Altschul et al., 1990). We identified
a total of 6,630 gene families from which we extracted the single-gene
orthologous families (SGOs). Families were considered SGOs if we identified
a single-gene representative in each species (one-to-one orthologs), and to
account for lower coverage genomes and missing data we also considered
cases where a specific gene was not present in a species, i.e., one-to-zero orthology.
SGOs were only considered for subsequent analysis if they contained
more than seven species in total and if they contained no internal stop codons
(indicative of sequencing errors). In total, we retained 866 SGOs for further
analysis. Multiple sequence alignments (MSAs) were generated using default
parameters in PRANK (v.100802) (Lo¨ ytynoja and Goldman, 2008). To minimize
potential false-positives due to poor sequence quality, the MSAs of the 866
SGOs underwent strict data-quality filtering. The first filter prohibited the
presence of gaps in the MSA if created by unique insertions (>12 bp) in either
bowhead or minke sequences. The second filter required unaligned bowhead
or minke sequences to be at least half the length of their respective MSA.
These two filters refined the number of testable SGOs to 319. The gene phylogeny
of each SGO was inferred from the species phylogeny (Morgan et al.,
2013). CodeML from the PAML software package (v.4.4e) (Yang, 2007) was
employed for our selective pressure variation analyses. We analyzed each of
the 319 refined SGOs using the nested codon-based models of evolution under
a maximum likelihood framework. We employed the likelihood ratio test
(LRT) using nested models of sequence evolution to evaluate a variety of
models of codon sequence evolution (Yang, 2007). In general, these codon
models allow for variable dN/dS ratios (referred to as u throughout) among
sites in the alignment, along different lineages on our phylogenetic tree, or a
combination of both variations across lineages and sites. To assess the significance
of fit of each model to the data, we used the recommended LRTs
in CodeML (Yang, 2007) for comparing nested models (see Supplemental
Folder 2). The LRT test statistic approximates the chi-square (c2) distribution
critical value with degrees of freedom equal to the number of additional free
parameters in the alternative model. The goal of the codon-based modeling
is to determine the selective pressures at work in a lineage and site-specific
manner.
The models applied follow the standard nomenclature (i.e., model M1, M2,
A, and A null) (Yang, 2007). Model M1 assumes that there are two classes of
sites—those with an u value of zero and those with an u value of 1. Model
M2 allows for three classes of sites—one with an u value of zero, one with
an u value of one and one with an u value that is not fixed to any value. Given
the relationship between M1 and M2, they can be tested for the significance of
the difference of the fit of these two models using an LRT with df = 2. Finally, we
used model A that allows the u value to vary across sites and across different
lineages in combination. With model A, we can estimate the proportion of sites
and the dN/dS ratio in the foreground lineage of interest in comparison to the
background lineages and the estimated dN/dS ratio is free to vary above 1 (i.e.,
positive selection). Model A can be compared with its site-specific counterpart
(model M1) using the LRT with df = 2. In addition, the lineage and site-specific
model model A null was applied as a second LRT with model A. In model A null,
the additional site category is fixed at neutral rather than being estimated from
the data, and this LRT provides an additional test for model A (Zhang et al.,
2005). In this way, we performed independent tests on each of the extant cetacean
lineages (orca, minke, and bowhead), as well as testing each ancestral
cetacean branch (the MRCA of the two baleen whales and the MRCA of all
three cetaceans), to determine if there were signatures of positive selection
that are unique to each lineage (Yang and dos Reis, 2011). Using empirical
Bayesian estimations, we identified the specific residues that are positively
selected in each lineage tested. Positive selection was inferred if all of the
following criteria were met: (1) if the LRT was significant, (2) if the parameters
estimated under that model were concurrent with positive selection, and (3) if
the alignment in that region was of high quality (as judged by alignmenton completeness and quality in that region). The posterior probability (PP) of a
positively selected site is estimated using two calculations: Naive Empirical
Bayes (NEB) or Bayes Empirical Bayes (BEB) (Yang, 2007). If both NEB and
BEB are predicted, we reported the BEB results as they have been shown to
be more robust under certain conditions (Yang et al., 2005). For all models
used in the analysis where u is estimated from the data, a variety of starting
u values was used for the calculation of likelihood estimates. This ensures
that the global minimum is reached.
ที่จะต้องประเมินการเปลี่ยนแปลงในความดันเลือกใน bowhead ที่มิงค์,
และ lineages
ปลาวาฬเพชรฆาตในการเปรียบเทียบกับเลี้ยงลูกด้วยนมที่ยังหลงเหลืออยู่ในโลกเราได้สร้างฐานข้อมูลการเข้ารหัสโปรตีนทอดเลี้ยงลูกด้วยนมรก พร้อมกับปลาวาฬเพชรฆาต (http://www.ncbi.nlm.nih.gov/bioproject/189949), มิงค์ (ยิ้ม et al., 2014) และข้อมูล bowhead อธิบายไว้ข้างต้นเราสกัดโปรตีนเข้ารหัสลำดับจากEnsembl Biomart โวลต์ 73 ต่อไปนี้ (Flicek et al, 2013). 18 จีโนม: ลิงชิมแปนซี, วัว, สุนัข, ช้าง, ชะนี (5.63 คุ้มครอง) กอริลลา, หนูตะเภาม้ามนุษย์ลิง, ลิง, microbat เมาส์หนูพันธุ์, ลิงอุรังอุตัง ตุ่นปากเป็ดกระต่ายและหนู เหล่านี้เป็นจีโนมทั้งหมดสูงคุ้มครอง (ส่วนใหญ่> 63 คุ้มครอง) มีข้อยกเว้นของชะนี (การเสริมโฟลเดอร์ 2) ค้นหาความคล้ายคลึงกันลำดับถูกดำเนินการโดยใช้ระเบิด-MPI (V 1.6.0) (Altschul et al., 1990) (http://www.mpiblast.org/) บนโปรตีนทั้งหมดโดยใช้เกณฑ์ของ10? 7 ยีนครอบครัวถูกระบุโดยใช้ซอฟแวร์ในบ้านที่กลุ่มที่ยีนที่อยู่บนพื้นฐานของการระเบิดซึ่งกันและกันฮิต (Altschul et al., 1990) เราระบุรวมเป็น 6,630 ครอบครัวยีนจากที่เราสกัดยีนเดียวครอบครัวorthologous (SGOs) ครอบครัวที่ได้รับการพิจารณา SGOs ถ้าเราระบุตัวแทนเดียวของยีนในแต่ละสายพันธุ์(หนึ่งต่อหนึ่ง orthologs) และการบัญชีสำหรับจีโนมของความคุ้มครองที่ลดลงและข้อมูลที่หายไปเรายังพิจารณากรณีที่ยีนที่เฉพาะเจาะจงไม่ได้อยู่ในสายพันธุ์คืออย่างใดอย่างหนึ่งเพื่อเป็นศูนย์ orthology. SGOs ได้รับการพิจารณาเฉพาะสำหรับการวิเคราะห์ที่ตามมาถ้าพวกเขามีมากกว่าเจ็ดชนิดรวมและถ้าพวกเขามีไม่หยุดcodons ภายใน(แสดงให้เห็นถึงข้อผิดพลาดลำดับ) โดยรวมแล้วเราเก็บไว้ 866 SGOs ต่อการวิเคราะห์ การจัดแนวลำดับหลาย (MSAs) ถูกสร้างขึ้นโดยใช้ค่าเริ่มต้นพารามิเตอร์ในPRANK (v.100802) (ytynoja แท้จริงและโกลด์แมน 2008) เพื่อลดศักยภาพบวกเท็จเนื่องจากคุณภาพลำดับยากจน MSAs ของ 866 SGOs เปลี่ยนกรองข้อมูลที่มีคุณภาพที่เข้มงวด ตัวกรองแรกที่ต้องห้ามการปรากฏตัวของช่องว่างใน MSA ถ้าสร้างขึ้นโดยการแทรกที่ไม่ซ้ำกัน (> 12 bp) ทั้งใน bowhead หรือลำดับมิงค์ ตัวกรองที่สองต้อง unaligned bowhead หรือมิงค์ลำดับเป็นอย่างน้อยครึ่งหนึ่งของความยาวของตน MSA. เหล่านี้สองตัวกรองกลั่นจำนวน SGOs ทดสอบเพื่อ 319 เชื้อชาติยีนของแต่ละSGO ได้รับการสรุปจากเชื้อชาติสายพันธุ์ (มอร์แกน, et al , 2013) CodeML จากแพคเกจซอฟต์แวร์ PAML (v.4.4e) (Yang, 2007) ถูกใช้สำหรับการเปลี่ยนแปลงความดันเลือกของเราจะวิเคราะห์ เราวิเคราะห์แต่ละ319 SGOs กลั่นโดยใช้รูปแบบตาม codon ที่ซ้อนกันของวิวัฒนาการภายใต้กรอบความน่าจะเป็นสูงสุด เรามีงานทำการทดสอบความน่าจะเป็นอัตราส่วน(LRT) โดยใช้แบบจำลองที่ซ้อนกันของวิวัฒนาการตามลำดับในการประเมินความหลากหลายของรูปแบบของการวิวัฒนาการลำดับcodon (Yang, 2007) โดยทั่วไป codon เหล่านี้รุ่นอนุญาตให้มีอัตราส่วนตัวแปรDN / DS (เรียกว่ายูตลอด) ในหมู่เว็บไซต์ในการจัดตำแหน่งพร้อมlineages ที่แตกต่างกันบนต้นไม้สายวิวัฒนาการของเราหรือการรวมกันของทั้งสองรูปแบบทั่วlineages และเว็บไซต์ เพื่อประเมินความสำคัญของความพอดีของแต่ละรุ่นกับข้อมูลที่เราใช้ LRTs แนะนำในCodeML (Yang, 2007) สำหรับการเปรียบเทียบรูปแบบที่ซ้อนกัน (ดูเพิ่มเติมโฟลเดอร์2) สถิติการทดสอบ LRT ใกล้เคียงกับไคสแควร์ (c2) การกระจายค่าที่สำคัญที่มีองศาอิสระเท่ากับจำนวนของฟรีเพิ่มเติมพารามิเตอร์ในรูปแบบทางเลือก เป้าหมายของการสร้างแบบจำลอง codon ตามที่คือการกำหนดแรงกดดันเลือกที่ทำงานอยู่ในสายเลือดและเว็บไซต์ที่เฉพาะเจาะจงอย่าง. รุ่นที่ใช้ตามศัพท์มาตรฐาน (เช่นรุ่น M1, M2, และ null) (Yang, 2007 ) รุ่น M1 สมมติว่ามีสองชั้นของเว็บไซต์เหล่านั้นมีมูลค่ายูของศูนย์และผู้ที่มีค่าของท่าน1. รุ่นM2 ช่วยให้สามชั้นเรียนของเว็บไซต์หนึ่งที่มีค่าของท่านเป็นศูนย์หนึ่งที่มีค่าของท่านอย่างใดอย่างหนึ่งและเป็นหนึ่งที่มีค่ายูที่ไม่ได้รับการแก้ไขเพื่อให้มีค่าใด ๆ ได้รับความสัมพันธ์ระหว่าง M1 และ M2 ที่พวกเขาสามารถได้รับการทดสอบสำหรับความสำคัญของความแตกต่างของความพอดีของทั้งสองรุ่นใช้LRT กับที่สั่ง df = 2 สุดท้ายเราใช้รูปแบบที่ช่วยให้ยูค่าที่แตกต่างกันในเว็บไซต์และข้ามที่แตกต่างกันlineages ในการรวมกัน ด้วยรูปแบบที่เราสามารถประมาณการสัดส่วนของเว็บไซต์และ DN / อัตราส่วน dS ในวงศ์เบื้องหน้าที่น่าสนใจในการเปรียบเทียบกับ lineages พื้นหลังและอัตราส่วนประมาณ DN / DS มีอิสระที่จะแตกต่างกันดังกล่าวข้างต้น 1 (เช่นเลือกบวก) รุ่น A สามารถนำมาเปรียบเทียบกับคู่ของเว็บไซต์ที่เฉพาะเจาะจงของ(รุ่น M1) โดยใช้ LRT กับ DF = 2. นอกจากนี้เชื้อสายและเว็บไซต์ที่เฉพาะเจาะจงรูปแบบรูปแบบโมฆะถูกนำมาใช้เป็นLRT ที่สองกับเอรูปแบบในรูปแบบโมฆะ , หมวดหมู่เว็บไซต์เพิ่มเติมคงที่เป็นกลางมากกว่าการประเมินจากข้อมูลและ LRT นี้ให้การทดสอบเพิ่มเติมสำหรับรุ่น A (Zhang et al., 2005) ด้วยวิธีนี้เราทำการทดสอบอิสระในแต่ละปลาวาฬที่ยังหลงเหลืออยู่lineages (ปลาวาฬเพชรฆาต, มิงค์และ bowhead) เช่นเดียวกับการทดสอบแต่ละบรรพบุรุษสาขาปลาวาฬ(คน MRCA ของทั้งสองปลาวาฬพบปะและ MRCA ของทุกสามcetaceans) เพื่อ ตรวจสอบว่ามีลายเซ็นของการเลือกในเชิงบวกที่เป็นเอกลักษณ์ของแต่ละเชื้อสาย(ยางและ dos Reis 2011) ใช้เชิงประจักษ์ประมาณการคชกรรมเราระบุตกค้างเฉพาะที่มีการบวกเลือกในสายเลือดแต่ละการทดสอบ เลือกบวกได้สรุปถ้าทั้งหมดของเกณฑ์ต่อไปนี้ได้พบกับ (1) ถ้า LRT อย่างมีนัยสำคัญ (2) ถ้าพารามิเตอร์ที่ประมาณภายใต้รูปแบบที่มีความพร้อมกันกับการเลือกในเชิงบวกและ(3) ในกรณีที่การจัดตำแหน่งในพื้นที่ที่เป็นของที่มีคุณภาพสูง (ตามที่ตัดสินโดยครบถ้วน alignmenton และคุณภาพในภูมิภาคนั้น) ความน่าจะเป็นหลัง (PP) ของเว็บไซต์ที่เลือกบวกประมาณโดยวิธีการคำนวณที่สอง: หน่อมแน้มเชิงประจักษ์เบส์ (NEB) หรือเบส์เชิงประจักษ์เบส์ (BEB) (Yang, 2007) หากทั้งสอง NEB และBEB ที่คาดว่าเรารายงานผลการ BEB ที่พวกเขาได้รับการแสดงที่จะมีประสิทธิภาพมากขึ้นภายใต้เงื่อนไขบาง(Yang et al., 2005) สำหรับทุกรุ่นที่ใช้ในการวิเคราะห์ที่ u เป็นที่คาดจากข้อมูลที่มีความหลากหลายของการเริ่มต้นค่ายูถูกนำมาใช้ในการคำนวณประมาณการโอกาส เพื่อให้แน่ใจว่าขั้นต่ำทั่วโลกจะมาถึง
การแปล กรุณารอสักครู่..

จะต้องประเมินการเปลี่ยนแปลงในความดันที่ใช้ใน bowhead มิงก์
, , และเมื่อเปรียบเทียบกับ Orca ยังบกสัตว์เลี้ยงลูกด้วยนม เราสร้างฐานข้อมูล
โปรตีนซึ่งสัตว์เลี้ยงลูกด้วยนมคนไทยนะครับ พร้อมกับ
ปลาวาฬ ( http : / / www.ncbi . nlm . NIH . gov / bioproject / 189949 ) มิงก์ ( ยิม et al . ,
2014 ) และ bowhead ข้อมูลที่อธิบายไว้ข้างต้นเราได้นะครับ
ensembl ลำดับจากโปรตีน biomart โวลต์73 ( flicek et al . , 2013 ) สำหรับ 18 จีโนมต่อไปนี้
: ลิงชิมแปนซี วัว สุนัข ช้าง ชะนี ( 5.63 ครอบคลุม ) ,
กอริลลา , หนูตะเภา , ม้า , มนุษย์ , ลิงมาโมเสท , ,
microbat , เมาส์ , โอพอสซั่มอุรังอุตัง , ตุ่นปากเป็ด , กระต่ายและหนู หาเหล่านี้ทั้งหมดสูง
ครอบคลุม ( ส่วนใหญ่ > 63 ครอบคลุม ) ด้วยข้อยกเว้นของชะนี ( โฟลเดอร์เพิ่มเติม
2 )ค้นหาความเหมือนลำดับการใช้ MPI ระเบิด
( ( 08 ) ( แอลเชิล et al . , 1990 ) ( http://www.mpiblast.org/ ) ต่อโปรตีนทั้งหมด โดยใช้เกณฑ์ของ 10
7
ยีนครอบครัวถูกระบุใช้ในซอฟต์แวร์ที่
กลุ่มยีนตามแบบฮิตระเบิด ( แอลเชิล et al . , 1990 ) เราระบุ
รวม 6630 ครอบครัวยีนที่เราสกัด
ยีนเดี่ยวครอบครัว orthologous ( sgos ) ครอบครัว ถือว่าเป็น sgos ถ้าเราระบุ
ตัวแทนยีนเดียวในแต่ละชนิด ( แบบ orthologs ) และบัญชีเพื่อลดความคุ้มครอง
หาข้อมูลที่หายไปและเรายังถือว่า
กรณีที่ยีนที่เฉพาะเจาะจงไม่ได้อยู่ในสายพันธุ์ เช่น หนึ่งศูนย์ orthology .
sgos เป็นเพียงการพิจารณาการวิเคราะห์ที่ตามมาถ้าพวกเขา ที่มีอยู่
กว่าเจ็ดชนิดในทั้งหมดและถ้าพวกเขามีไม่มีซิสหยุดภายใน
( อาการของข้อผิดพลาดลำดับ ) โดยรวมเรายังคงตาม sgos สำหรับการวิเคราะห์ต่อไป
การลำดับหลาย ( มซาส ) ถูกสร้างขึ้นโดยใช้พารามิเตอร์เริ่มต้น
ในเล่นตลก ( v.100802 ) ( โลตั้ง ytynoja และโกลด์แมน , 2008 ) เพื่อลด
บวกเท็จที่มีศักยภาพเนื่องจากคุณภาพลำดับไม่ดี , 866
มซาสในsgos ได้รับเข้มงวดคุณภาพข้อมูลการกรอง ตัวกลั่นกรองแรก ห้าม
ที่มีช่องว่างใน MSA โดยเฉพาะถ้าสร้างใหม่ ( 12 bp ) เหมือนกัน
bowhead หรือมิงก์ ลำดับ ตัวกรองที่สองต้อง unaligned bowhead
หรือมิงก์ดังนี้เป็นอย่างน้อยครึ่งหนึ่งของความยาวของ MSA ของตน .
2 ตัวกรองกลั่นจำนวนทดสอบได้ sgos เพื่อคุณ . ระบบเชื้อชาติ
ยีนของแต่ละ SGO มีทั้งชนิดระบบเชื้อชาติ ( มอร์แกน et al . ,
2013 ) codeml จาก paml แพคเกจซอฟต์แวร์ ( v.4.4e ) ( Yang , 2007 ) คือ
ในการวิเคราะห์ของเราดันเลือกวิธี เราวิเคราะห์กัน
sgos 319 กลั่นโดยใช้รหัสซ้อนตามรูปแบบของวิวัฒนาการภายใต้
กรอบอันดับสูงสุด เราใช้โอกาสทดสอบอัตราส่วน
( LRT ) โดยใช้รูปแบบของวิวัฒนาการลำดับซ้อนกันเพื่อประเมินความหลากหลายของรูปแบบของวิวัฒนาการลำดับ codon
( Yang , 2007 ) โดยทั่วไปรูปแบบ codon
เหล่านี้อนุญาตให้อัตราส่วน DN / DS ตัวแปร ( เรียกว่า U ตลอด ) ระหว่าง
เว็บไซต์ในการจัดแนวตามเผ่าพันธุ์ที่แตกต่างกันบน phylogenetic ต้นไม้ของเรา , หรือการรวมกันของทั้งสองรูปแบบเว็บไซต์
ข้ามเชื้อชาติและ . เพื่อประเมินความสำคัญ
พอดีของแต่ละโมเดลกับข้อมูลที่เราเคยแนะนำ lrts
ใน codeml ( Yang , 2007 ) สำหรับการเปรียบเทียบโมเดลที่ซ้อนกันอยู่ ( ดูโฟลเดอร์เพิ่มเติม
2 ) สถิติทดสอบไคสแควร์กับ LRT ( C2 ) กระจาย
ค่าวิกฤตที่มีองศาเสรีเท่ากับจำนวนเพิ่มเติมฟรี
พารามิเตอร์ในรูปแบบทางเลือก เป้าหมายของการใช้แบบจำลอง
โคดอนคือการ ระบุว่า แรงกดดันที่เลือกทำงานในสายเลือดและลักษณะเฉพาะ
.
แบบประยุกต์ตามระบบมาตรฐาน ( เช่น รุ่น M1 M2
, และ null ) ( Yang , 2007 ) รุ่น M1 ถือว่ามีสองชั้นเรียนของ
เว็บไซต์เหล่านั้นที่มีค่า U ของศูนย์และผู้ที่มีคุณค่าของ 1 แบบจำลอง
m2 ให้สามประเภทของเว็บไซต์หนึ่งที่มีคุณค่าของศูนย์ กับ
เป็นค่า U ของหนึ่งและหนึ่งที่มีค่า U ที่ไม่คงที่ใด ๆค่า ให้
ความสัมพันธ์ระหว่าง M1 และ M2 ก็สามารถทดสอบนัยสำคัญของความแตกต่างของ
พอดี ทั้งสองรุ่นใช้ LRT กับ df = 2 สุดท้ายเรา
ใช้แบบจำลองที่อนุญาตให้คุณมูลค่าแตกต่างกันไปในเว็บไซต์และข้ามเชื้อชาติที่แตกต่างกัน
ในการรวมกัน แบบ Aเราสามารถประเมินสัดส่วนของเว็บไซต์
และ DN / DS อัตราส่วนในเบื้องหน้า เชื้อสายของความสนใจในพื้นหลังเมื่อเปรียบเทียบกับ
และคาดว่าอัตราส่วน DN / DS ฟรีแตกต่างกันข้างต้น 1 ( เช่น
บวกเลือก ) แบบจำลองสามารถเปรียบเทียบกับ
คู่ของเฉพาะ ( รุ่น 1 ) โดยใช้ LRT กับ df = 2 นอกจากนี้ สายเลือดและเฉพาะ
โมเดลเป็น null คือใช้เป็นสองแบบ 1 . แบบ LRT เป็น null
หมวดหมู่เว็บไซต์เพิ่มเติมที่เป็นกลางมากกว่าถูกประเมินจาก
ข้อมูลนี้และให้ทดสอบเพิ่มเติมสำหรับ LRT โมเดล ( Zhang et al . ,
2005 ) วิธีนี้เราดำเนินการทดสอบอิสระของแต่ละเผ่าพันธุ์ปลาวาฬ
เท่าที่มีอยู่ ( orca มิงก์ และ bowhead ) ตลอดจนการทดสอบแต่ละบรรพบุรุษ
สาขาปลาวาฬ ( mrca ของทั้งสองบาลีนปลาวาฬและ mrca เลย
3 สัตว์น้ำเลี้ยงลูกด้วยนม ) เพื่อตรวจสอบว่ามีลายเซ็นของบวกเลือก
ที่เป็นเอกลักษณ์ของแต่ละวงศ์ ( หยางและ Dos Reis , 2011 ) การใช้ข้อมูลเชิงประจักษ์
คชกรรมการเราระบุเฉพาะตกค้างที่บวก
เลือกในแต่ละการทดสอบ สรุป ถ้าเลือกบวกทั้งหมดของ
เกณฑ์ต่อไปนี้ที่พบ : ( 1 ) หาก LRT อย่างมีนัยสำคัญทางสถิติ ( 2 ) ถ้าค่า
ประมาณตามรูปแบบที่สอดคล้องกับการเลือกที่เป็นบวก และ ( 3 ) ถ้าแนวเขต
ที่คุณภาพสูง ( ตัดสินโดย alignmenton ครบถ้วนและคุณภาพในภูมิภาค ) น่าจะเป็นด้านหลัง ( PP ) ของทางเว็บไซต์เป็นวิธีเลือก
2 : ไร้เดียงสาเชิงคำนวณเบส์ ( Bayes Bayes เอ็น ) หรือเชิงประจักษ์ ( เบ๊บ ) ( Yang , 2007 ) ถ้าทั้งสองด้านและ
เบ๊บจะคาดการณ์ เรารายงานเบ๊บผลลัพธ์จะถูกแสดง
จะมีเสถียรภาพมากขึ้น ภายใต้เงื่อนไขบางอย่าง ( หยาง et al . , 2005 ) สำหรับทุกรุ่นที่ใช้ในการวิเคราะห์ที่ u
( จากข้อมูลที่หลากหลายตั้งแต่
u ค่าถูกใช้เพื่อคำนวณความน่าจะเป็นประมาณ นี้มั่นใจ
ที่สุดทั่วโลกถึง
การแปล กรุณารอสักครู่..
