Introduction
Founder effects, genetic drift and recombination associated with
the global spread of HIV-1 infection have given rise to genetically
distinct viral strains referred to as ‘subtypes’ and ‘circulating
recombinant forms’ [1]. HIV-1 genetic diversity may impact on
disease progression and response to antiretroviral therapy, and has
implications for vaccine development [2]. It is therefore important
to monitor changes in the genetic and geographic complexity of
the HIV-1 epidemic, and to identify the processes that drive these
changes. Of the various HIV-1 strains that have been described, the most
prevalent worldwide is subtype C [3]. First described in East and
Southern Africa [4], infections with viruses belonging to (or
partially derived from) subtype C are now prevalent in regions
throughout the world, including India, China, and South Americ In many of the regions where it has been introduced,
subtype C has overtaken other HIV-1 strains introduced at earlier
times [6–9]. Notably, studies suggest that subtype C may acquire
multi-drug resistance more rapidly than other HIV-1 subtypes
The rapid spread of subtype C in regions of South America -
including Brazil, Argentina and Uruguay - has drawn particular
attention [12–16]. Recent studies indicate that the South
American subtype C epidemic likely derives from a single founder
virus that entered the continent via Southern Brazil, and was
derived from viral strains prevalent in East Africa [12,13].
However, the external route via which this virus spread from
East Africa to South America has remained mysterious.
In the United Kingdom (UK), the prevalence of subtype C has
increased steadily since the early 1990s, and it now ranks as the
second most prevalent HIV-1 subtype after subtype B [17]. The overwhelming majority of subtype C infections in the UK occur in
individuals whose reported exposure risk is heterosexual contact,
and who were likely infected in Southern or Eastern Africa [18].
However, in a previous analyses of HIV-1 genetic diversity [19],
we observed that some subtype C isolates sampled within the UK
exhibit high levels of genetic similarity to isolates obtained in
South America. To explore this finding in greater detail, we
screened 8,309 subtype C sequences sampled within the UK to
identify isolates genetically linked to the South American
epidemic. We then examined the genetic relationships of these
isolates to subtype C isolates sampled worldwide evolutionary rate and the date of the most recent common
ancestor (MRCA) were performed using a Bayesian Markov chain
Monte Carlo (MCMC) approach as implemented in BEAST v1.7.
Analyses were performed with a Bayesian Skyline coalescent tree
prior, under the GTR + I + C model of nucleotide substitution,
and using both a strict and a relaxed molecular clock (uncorrelated
Lognormal model). Two separate MCMC chains were run for 108
generations for each dataset, sampled every 10,000th generation.
BEAST output was analyzed using TRACER v1.4 [27], with
uncertainty in parameter estimates reflected in the 95% highest
probability density (HPD) values after excluding a burn-in of 10%.
Methods
Study Group and Reference Sequences
8,309 subtype C pol gene sequences sampled within the UK
were obtained from the UK HIV Drug Resistance Database
(www.hivrdb.org.uk). These sequences were generated by population
sequencing from plasma samples collected between 1996
and 2008, and were anonymously linked to data (obtained under
voluntary agreement of patients) describing the ethnicity, nationality
(country of birth) and exposure risk group of infected
individuals. Sequences were at least 1000 nucleotides in length,
spanning the genomic region between 2,253 and 3,251 nucleotides
(HXB2 coordinates). Sequences are available on request from the
UK HIV Drug Resistance Database.
A globally sampled reference sequence set comprising 1,289
previously published subtype C pol gene sequences annotated by
country of sampling was obtained from the Los Alamos HIV
Sequence Database (www.hiv.lanl.gov). The reference set included
sequences from Argentina (n= 8), Burundi (n= 92), Brazil
(n =122), Botswana (n= 144), Ethiopia (n =101), India (n =74),
Kenya (n= 3), Tanzania (n =65), Uganda (n= 11), South Africa
(n =667) and the UK (n =2). The IDs of reference sequences used
in this study are provided as supplementary information (File S1).
Sequence Analysis
Sequences were classified into phylogenetic groups (i.e.
subtypes, circulating recombinant forms and within-subtype
lineages) using the REGA HIV-1 subtyping tool (version 2.0,
available at: www.bioafrica.net) [20–22]. Sequence alignments
were created using MUSCLE [23] and manually edited.
Maximum likelihood phylogenies were constructed using PhyML
[24] and parameters estimated from the dataset (nucleotide
substitution model =HKY85, transition/transversion ratio = 4.0,
gamma shape parameter = 0.780). Bayesian phylogenetic analysis
was performed using MrBayes v3.1.2 [25]. Bayesian phylogenies
were inferred using the GTR+I+C nucleotide substitution selected
using Modeltest [26]. For each dataset, two runs (one cold and one
tree heated, tempJ0.20) of four chains each were run for 107
generations, with trees sampled every 1000th generation. The
burn-in of 10% was excluded from the analysis. Convergence of
parameters was assessed by calculating the effective sample size
(ESS) using TRACER v1.4 [27], excluding an initial 10% for each
run. All parameters estimates for each run showed ESS values
more than 300. Shared drug resistance mutations were identified
using the calibrated population resistance (CPR) tool [28].
Estimation of Evolutionary Rates and Dates
All sequences used for estimation of dates were examined for
evidence of inter- and intra-subtype recombination. Sequences
that were not classified as pure (non-recombinant) subtype C by
REGA (inter-subtype recombination) [21,22] and SCUEL (intrasubtype
recombination) [29] were excluded. Estimates of the
แนะนำผลผู้ก่อตั้ง ดริฟท์พันธุ และ recombination ที่เกี่ยวข้องกับการแพร่กระจายทั่วโลกติดเชื้อเอชไอวี-1 ให้สูงขึ้นเพื่อแปลงพันธุกรรมสายพันธุ์ไวรัสที่แตกต่างกันเรียกว่า 'subtypes' และ ' การหมุนเวียนrecombinant ฟอร์ม [1] ความหลากหลายทางพันธุกรรมของเชื้อเอชไอวี-1 อาจส่งผลกระทบในความก้าวหน้าของโรคและการตอบสนองต่อการรักษาด้วย และมีผลการพัฒนาวัคซีน [2] จึงเป็นสิ่งสำคัญการตรวจสอบการเปลี่ยนแปลงในความซับซ้อนทางพันธุกรรม และทางภูมิศาสตร์ของระบาดของเชื้อเอชไอวี-1 และกระบวนการที่ไดรฟ์เหล่านี้ระบุการเปลี่ยนแปลง ของสายพันธุ์ต่าง ๆ เอชไอวี-1 ที่มีการอธิบาย มากที่สุดแพร่หลายทั่วโลกเป็นชนิดย่อย C [3] อธิบายครั้งแรก ในตะวันออก และแอฟริกาใต้ [4], ติดเชื้อกับไวรัสอยู่ (หรือบางส่วนได้รับจาก) ขณะนี้เป็นชนิดย่อย C พบมากในภูมิภาคทั่วโลก รวมทั้งอินเดีย จีน และ Americ ใต้ในภูมิภาคซึ่งจะมีการแนะนำชนิดย่อย C มี overtaken อื่น ๆ สายพันธุ์เอชไอวี-1 ที่นำมาใช้ในรุ่นก่อนหน้าเวลา [6-9] ยวด การศึกษาแนะนำว่า ชนิดย่อย C อาจได้รับยาหลายอย่างรวดเร็วมากขึ้นกว่า subtypes อื่น ๆ เอชไอวี-1อย่างรวดเร็วในการแพร่กระจายของชนิดย่อย C ในภูมิภาคอเมริกาใต้-รวมทั้งบราซิล อาร์เจนตินา และ อุรุกวัย - ได้วาดเฉพาะสนใจ [12-16] การศึกษาล่าสุดบ่งชี้ว่า ภาคใต้โรคระบาดชนิดย่อยอเมริกัน C น่าจะมาจากผู้ก่อตั้งที่เดียวไวรัส ที่ป้อนทวีปผ่านใต้บราซิล ถูกมาจากสายพันธุ์ไวรัสที่แพร่หลายในแอฟริกาตะวันออก [12,13]อย่างไรก็ตาม ภายนอกเส้นทางที่ไวรัสนี้แพร่กระจายจากแอฟริกาตะวันออกไปยังทวีปอเมริกาใต้มียังคงลึกลับมีความชุกของชนิดย่อย C ในสหราชอาณาจักร (UK),เพิ่มขึ้นอย่างต่อเนื่องตั้งแต่ช่วงต้นทศวรรษ 1990 และก็ตอนนี้เป็นอันดับสองแพร่หลายมากที่สุด 1 เอชไอวีชนิดย่อยหลังจากชนิดย่อย B [17] ชนิดย่อย C เชื้อในสหราชอาณาจักรส่วนใหญ่เกิดขึ้นในติดต่อบุคคลที่มีความเสี่ยงรายงานความเสี่ยงเป็นรักต่างเพศและที่มีโอกาสติดเชื้อในแอฟริกาใต้ หรือตะวันออก [18]อย่างไรก็ตาม ในวิเคราะห์ก่อนหน้านี้ของเอชไอวี-1 พันธุ [19],เราพบว่า บางชนิดย่อย C แยกตัวอย่างภายในสหราชอาณาจักรแสดงความคล้ายคลึงกันทางพันธุกรรมเพื่อแยกได้ในระดับสูงอเมริกาใต้ การสำรวจนี้ค้นหาในรายละเอียดมากขึ้น เราลำดับ C ชนิดย่อย 8,309 ตัวอย่างภายในสหราชอาณาจักรเพื่อฉายระบุแยกแปลงพันธุกรรมกับอเมริกาใต้โรคระบาด เราตรวจสอบความสัมพันธ์ทางพันธุกรรมเหล่านี้แล้วแยกเพื่อแยกชนิดย่อย C ตัวอย่างอัตราวิวัฒนาการทั่วโลกและทั่วไปล่าสุดวันบรรพบุรุษ (MRCA) ได้ดำเนินการโดยใช้โซ่ Markov ทฤษฎีวิธี Carlo มอน (MCMC) นำมาใช้ในสัตว์ v1.7วิเคราะห์ดำเนินกับสกายไลน์ทฤษฎีต้นไม้ coalescentก่อน ภายใต้ GTR ฉัน + รุ่น C นิวคลีโอไทด์แทนและการใช้เข้มงวดและนาฬิกาโมเลกุลผ่อนคลาย (uncorrelatedรูปแบบ lognormal) สองแยก MCMC โซ่ถูกเรียกใช้สำหรับ 108รุ่นสำหรับแต่ละชุดข้อมูล ตัวอย่างทุกรุ่น 10,000thผลผลิตสัตว์ถูกวิเคราะห์ด้วยติดตามคืนชีพ [27],ความไม่แน่นอนในการประเมินพารามิเตอร์ในสูงสุด 95%ค่าความหนาแน่นความน่าเป็น (HPD) หลังจากการยกเว้นการเผาไหม้ใน 10%วิธีการกลุ่มศึกษาและอ้างอิงลำดับ8,309 ชนิดย่อย C pol ยีนลำดับตัวอย่างภายในสหราชอาณาจักรได้รับมาจากฐานข้อมูลยาต้านเอชไอวีสหราชอาณาจักร(www.hivrdb.org.uk) ลำดับเหล่านี้สร้างขึ้นตามจำนวนประชากรจัดลำดับจากพลาสม่าตัวอย่างเก็บรวบรวมระหว่างปี 1996และ 2551 และการเชื่อมโยงข้อมูล (ได้รับภายใต้โดยไม่ระบุชื่อข้อตกลงการสมัครใจของผู้ป่วย) อธิบายเชื้อชาติ สัญชาติ(ประเทศเกิด) และกลุ่มความเสี่ยงความเสี่ยงของการติดเชื้อคน ลำดับนิวคลีโอไทด์น้อย 1000 ยาวรัฐภูมิภาค genomic ระหว่าง 2,253 และ 3,251 นิวคลีโอไทด์(พิกัด HXB2) ลำดับตามคำขอจากสหราชอาณาจักรเชื้อเอชไอวียาต้านทานแล้วชุดลำดับทั่วโลกตัวอย่างอ้างอิงประกอบด้วย 1,289ก่อนหน้านี้ประกาศย่อย C pol ยีนลำดับใส่คำอธิบายประกอบด้วยประเทศที่สุ่มได้รับจากเอชไอวี Los Alamosลำดับฐาน (www.hiv.lanl.gov) การอ้างอิงที่ตั้งอยู่ลำดับจากอาร์เจนตินา (n = 8), บุรุนดี (n = 92), บราซิล(n = 122), สาธารณรัฐบอตสวานา (n = 144), ประเทศเอธิโอเปีย (n = 101), อินเดีย (n = 74),เคนยา (n = 3), แทนซาเนีย (n = 65), ยูกันดา (n = 11), แอฟริกาใต้(n = 667) และอังกฤษ (n = 2) รหัสของลำดับการอ้างอิงที่ใช้ในการศึกษานี้มีข้อมูลเสริม (แฟ้ม S1)การวิเคราะห์ลำดับลำดับถูกแบ่งกลุ่ม phylogenetic (เช่นsubtypes หมุนเวียนรูปแบบ recombinant และภายในชนิดย่อยเชื้อชาติ) โดยใช้เครื่องมือ subtyping REGA เอชไอวี-1 (รุ่น 2.0มี: www.bioafrica.net) [20-22] จัดลำดับแนวถูกสร้างขึ้นโดยใช้กล้ามเนื้อ [23] และแก้ไขด้วยตนเองความเป็นไปได้สูงสุด phylogenies ถูกสร้างโดยใช้ PhyML[24] และพารามิเตอร์ที่ประเมินจากชุดข้อมูล (นิวคลีโอไทด์ทดแทนรุ่น = HKY85 อัตราการเปลี่ยน แปลง/transversion = 4.0พารามิเตอร์รูปร่างแกมมา = 0.780) ทฤษฎีวิเคราะห์ phylogeneticที่ดำเนินการโดยใช้ MrBayes v3.1.2 [25] ทฤษฎี phylogeniesได้สรุปการใช้ GTR ฉัน + C นิวคลีโอไทด์แทนเลือกใช้ Modeltest [26] สำหรับแต่ละชุดข้อมูล สองรัน (เย็นหนึ่งและหนึ่งแผนภูมิอุ่น tempJ0.20) ของกลุ่มที่สี่ แต่ละถูกเรียกใช้สำหรับ 107รุ่น มีตัวอย่างทุกรุ่น 1000th ที่เขียนใน 10% ถูกแยกออกจากการวิเคราะห์ บรรจบกันของพารามิเตอร์ที่ถูกประเมิน โดยการคำนวณขนาดตัวอย่างมีประสิทธิภาพ(ESS) ใช้ติดตามคืนชีพ [27], รวมเป็น 10% เริ่มต้นสำหรับแต่ละเรียกใช้ ประเมินสำหรับแต่ละค่า ESS แสดงรันพารามิเตอร์ทั้งหมดมากกว่า 300 ร่วมต่อต้านยาเสพติดระบุกลายพันธุ์ใช้เครื่องมือการต่อต้าน (CPR) ปรับเทียบประชากร [28]ประเมินราคาวิวัฒนาการและวันลำดับทั้งหมดที่ใช้สำหรับการประเมินที่ต้องถูกตรวจสอบสำหรับหลักฐานของ recombination อินเตอร์ - และอินทราชนิดย่อย ลำดับที่ไม่ถูกจัดประเภทเป็นบริสุทธิ์ (ไม่ใช่วททช) ชนิดย่อย C โดยREGA (ชนิดย่อยอินเตอร์ recombination) [21,22] และ SCUEL (intrasubtyperecombination) [29] ได้แยกออก ประเมินของการ
การแปล กรุณารอสักครู่..