number: NC_002695) and its large plasmid pO157 (accession number:
NC_002128) using the alignment tool BWA (Li and Durbin, 2010). The
SAMtools software package converted the SAM format files to BAM
format and sorted the BAM files (Li et al., 2009). SAMtools mpileup
generated BCF format files and bcftools was used to call the SNPs (between
reference and samples) in VCF format. SNPs were filtered with
the quality threshold set at a minimum read depth of five. SNP data
were transformed to binary, 0/1, data. Those sites where a SNP was
identified in the STEC strains under study (test strains) compared to
Sakai (reference strain) received a 1. A 0 was placed accordingly for
identical nucleotides on the genome of each test strain compared to the
reference strain Sakai. This resulted in a binary m by n matrix, where m
is the number of SNPs and n the number of test strains (n = 38).
2.4. Phenotypic data
The adhesive properties to human intestinal cells were used as a
proxy for virulence in this study. In total, 18 human O157 isolates
(H-numbers) and 20 animal O157 isolates (A-numbers) from lineage
I, I/II and II (see Table 1 for strain properties) were investigated and
compared. Differentiated Caco-2 cells were used as a representative
model system for human intestinal cells. They were produced, treated
and seeded as previously described by Oliveira et al. (2011). For adhesion
experiments the cells were seeded in 12-well plates at a concentration
of 1.6 × 105 cells/well. Each STEC strain was inoculated in BHI
broth and incubated overnight (ON) at 37 °C to obtain a culture consisting
of approximately 109 CFU/ml. Subsequently, three decimal dilutions
resulting in a STEC suspension of each strain of approximately
106 CFU/ml were made. From these last suspensions, Caco-2 cells in
12-well plates were inoculated with 40 μl per well, per STEC strain six
wells. Plates were centrifuged (1 min at 175 ×g) and incubated at
37 °C in a humidified atmosphere of 95% air and 5% CO2 for 1 h.
After incubation and three washings with pre-warmed sterile
phosphate-buffered saline (PBS), 1 ml 1% Triton-X100 in PBS (prewarmed)
was added to each well to detach the cells.
The detached cells were collected and the contents of three wells
were combined. Decimal dilutions were prepared in peptone physiological
salt solution, and the dilutions were plated on Brilliance™ E. coli/
coliforms Selective Agar (Oxoid, Badhoevedorp, The Netherlands).
3. Statistical data analysis
3.1. Phenotypic data
The fractional adherence was calculated by dividing the number of
STECs after the adhesion assay by the number of STECs added to the
Caco-2 cells. If cells are assumed to be homogeneously distributed in
the ON culture, then the number of cell counts per dilution is Poisson
distributed with a parameter λ. Based on this assumption, the best estimate
for λ, the expected number of cells in a sample, can be estimated
from counts in serial dilutions of the original sample according to
∑k
i¼j
ni
∑k
i¼j
10−i
, where n is the number of counts in the ith dilution. The
point estimate for the fraction of bacteria attached to the Caco-2 cells
isλ2
λ1
, where λ1 is the expected number of bacteria in the overnight culture
and λ2 is the expected number of bacteria attached to the Caco-2 cells.
3.2. Simple linear regression
The basic idea in this study is to identify SNPs in the test strains
that could be associated with an increased virulence behavior (represented
by relatively high Caco-2 cell attachment fractions compared to
other test strains without these SNPs).
The strength of this association can, in the most basic form, be estimated
using the following simple linear regression model for each SNP:
yi ¼ μ þ βxi þ εi ;
whereyi is the fractional Caco-2 adhesion for strain i, μ is the mean
response, β is the SNP effect, xi is an indicator variable with
xi ¼ 0 if the marker here ð Þ ; SNP score of test strain i is equal to the reference strain
1 otherwise;
and the residual errors, εi , have independent normal distributions with
variance σe
2
.
For each SNP the null hypothesis H0 : β = 0 is tested against an alternative
hypothesis Ha : β ≠ 0 and the P-values and effects β are calculated
and transformed to a −log10 scale.
In Genome Wide Association Studies (GWAS) a corresponding
test is applied for all markers. In terms of hazard identification this simplified
model would assign strains to one of two classes of hazards,
with different rates of adhesion, depending on the presence of a single
SNP.
There are several issues in GWAS studies that are more complex
than in standard linear regression. First of all, as the number of SNPs
(m) outweighs the number of test strains (here, n = 38) one has to
correct for multiple testing. If a standard 5% significance threshold per
จำนวน: NC_002695) และพลาสมิดขนาดใหญ่ pO157 (หมายเลขภาคยานุวัติ:
NC_002128) โดยใช้เครื่องมือการจัดตำแหน่ง BWA (Li และเดอร์บิน 2010)
แพคเกจซอฟต์แวร์ SAMtools แปลงไฟล์รูปแบบ SAM จะ BAM
รูปแบบและจัดเรียงไฟล์ BAM นี้ (Li et al., 2009) SAMtools mpileup
สร้าง BCF รูปแบบไฟล์และ bcftools ถูกใช้ในการเรียก SNPs
(ระหว่างการอ้างอิงและตัวอย่าง) ในรูปแบบ VCF SNPs
ถูกกรองด้วยเกณฑ์คุณภาพที่กำหนดไว้ที่ระดับความลึกอ่านอย่างน้อยห้า ข้อมูล SNP
ถูกเปลี่ยนไบนารี 0/1 ข้อมูล เว็บไซต์เหล่านั้นที่ SNP
ถูกระบุไว้ในสายพันธุ์STEC ภายใต้การศึกษา (สายพันธุ์ทดสอบ)
เมื่อเทียบกับซาไก(สายพันธุ์อ้างอิง) ได้รับ 1. 0 ถูกวางไว้ตามสำหรับนิวคลีโอเหมือนกันบนจีโนมของแต่ละสายพันธุ์ทดสอบเมื่อเทียบกับสายพันธุ์อ้างอิงซาไก นี้ส่งผลให้มไบนารีด้วย n เมทริกซ์ที่ม. คือจำนวนของ SNPs และ n จำนวนสายพันธุ์ทดสอบ (n = 38). 2.4 ข้อมูลฟีโนไทป์คุณสมบัติกาวไปยังเซลล์ในลำไส้ของมนุษย์ถูกนำมาใช้เป็นพร็อกซี่สำหรับความรุนแรงในการศึกษานี้ รวม 18 สายพันธุ์ O157 มนุษย์(H-ตัวเลข) และ 20 สัตว์สายพันธุ์ O157 (A ตัวเลข) จากเชื้อสายฉันI / II และครั้งที่สอง (ดูตารางที่ 1 คุณสมบัติสายพันธุ์) ได้รับการตรวจสอบและเปรียบเทียบ ที่แตกต่าง Caco-2 เซลล์ถูกนำมาใช้เป็นตัวแทนของระบบรูปแบบสำหรับเซลล์ในลำไส้ของมนุษย์ พวกเขามีการผลิตได้รับการรักษาและเมล็ดตามที่อธิบายไว้ก่อนหน้านี้โดย Oliveira et al, (2011) การยึดเกาะสำหรับการทดลองเซลล์เมล็ดในแผ่น 12 ได้ดีที่ความเข้มข้น 1.6 × 105 เซลล์ / ดี แต่ละสายพันธุ์ STEC ได้รับเชื้อใน BHI น้ำซุปและบ่มในชั่วข้ามคืน (ON) ที่ 37 ° C จะได้รับวัฒนธรรมประกอบด้วยประมาณ109 CFU / ml ต่อจากนั้นสามเจือจางทศนิยมผลในการระงับความเครียดของ STEC ประมาณแต่ละ 106 CFU / ml ถูกสร้างขึ้นมา จากสารแขวนลอยเหล่านี้ที่ผ่านมา Caco-2 เซลล์ในแผ่น12 ดีถูกเชื้อ 40 ไมโครลิตรต่อดีต่อความเครียด STEC หกหลุม แผ่นถูกหมุนเหวี่ยง (1 นาทีที่ 175 × g) และบ่มที่อุณหภูมิ37 องศาเซลเซียสในบรรยากาศที่ความชื้นของอากาศ 95% และ CO2 5% เป็นเวลา 1 ชม. หลังจากการบ่มและสามซักด้วยก่อนอุ่นหมันน้ำเกลือฟอสเฟตบัฟเฟอร์ (พีบีเอส) 1 มล. 1% Triton-X100 ในพีบีเอส (prewarmed) ถูกบันทึกอยู่ในแต่ละที่ดีที่จะแยกเซลล์. เซลล์เดี่ยวถูกเก็บรวบรวมและเนื้อหาของสามหลุมมารวมกัน เจือจางทศนิยมได้จัดทำขึ้นทางสรีรวิทยาเปปโตนสารละลายเกลือและเจือจางถูกชุบในความสดใส™เชื้อ E. coli / โคลิฟอร์มเลือกวุ้น (Oxoid, Badhoevedorp, เนเธอร์แลนด์). 3 การวิเคราะห์ข้อมูลทางสถิติ3.1 ข้อมูลฟีโนไทป์ยึดมั่นเศษส่วนที่คำนวณโดยการหารจำนวนSTECs หลังจากทดสอบการยึดเกาะด้วยจำนวน STECs ที่เพิ่มให้กับเซลล์Caco-2 หากเซลล์จะถือว่ามีการกระจายเป็นเนื้อเดียวกันในวัฒนธรรมบนแล้วจำนวนของจำนวนเซลล์ต่อการลดสัดส่วนจะ Poisson กระจายกับพารามิเตอร์λ อยู่บนสมมติฐานนี้ประมาณการที่ดีที่สุดสำหรับλ, จำนวนที่คาดหวังของเซลล์ในตัวอย่างสามารถประมาณได้จากการนับจำนวนในการเจือจางอนุกรมของกลุ่มตัวอย่างเดิมตามΣki¼jพรรณีΣki¼j 10 ฉันที่n เป็นจำนวน ของการนับในการลดสัดส่วนที่ i ประมาณการจุดส่วนของเชื้อแบคทีเรียที่ติดอยู่กับเซลล์ Caco-2 isλ2λ1ที่λ1เป็นจำนวนที่คาดหวังของแบคทีเรียในวัฒนธรรมในชั่วข้ามคืนและλ2เป็นจำนวนที่คาดหวังของเชื้อแบคทีเรียที่ติดอยู่กับCaco-2 เซลล์. 3.2 ง่ายการถดถอยเชิงเส้นความคิดพื้นฐานในการศึกษานี้คือการระบุ SNPs ในสายพันธุ์ทดสอบที่อาจจะเกี่ยวข้องกับพฤติกรรมความรุนแรงที่เพิ่มขึ้น(แสดงโดยค่อนข้างสูง Caco-2 เศษส่วนสิ่งที่แนบมามือถือเมื่อเทียบกับสายพันธุ์ทดสอบอื่นๆ โดยไม่ต้อง SNPs เหล่านี้). ความแข็งแรงของ สมาคมนี้สามารถในรูปแบบพื้นฐานที่สุดที่จะถูกประเมินโดยใช้รูปแบบการถดถอยเชิงเส้นที่เรียบง่ายต่อไปนี้สำหรับแต่ละSNP: ยี่¼μþβxiþεi; whereyi เป็นส่วนยึดเกาะ Caco-2 สำหรับสายพันธุ์ที่ผมμคือหมายถึงการตอบสนองβ เป็นผล SNP ซีอานเป็นตัวแปรตัวบ่งชี้ที่มีจิน¼ 0 ถ้าเครื่องหมายที่นี่ðÞ; คะแนน SNP สายพันธุ์ทดสอบฉันจะมีค่าเท่ากับสายพันธุ์อ้างอิง1 อย่างอื่น? และข้อผิดพลาดที่เหลือ, εiมีการแจกแจงปกติอิสระที่มีความแปรปรวนσe 2. สำหรับ SNP แต่ละสมมติฐาน H0: β = 0 มีการทดสอบกับทางเลือกสมมติฐานฮา: เบต้า≠ 0 และ P-ค่าและผลกระทบβคำนวณและเปลี่ยนไป-log10 ขนาด. ในสมาคมไวด์จีโนมการศึกษา (GWAS) ต่อที่สอดคล้องกันทดสอบจะนำมาใช้สำหรับเครื่องหมายทั้งหมด ในแง่ของการชี้บ่งอันตรายนี้ที่เรียบง่ายรูปแบบจะกำหนดสายพันธุ์ให้เป็นหนึ่งในสองชั้นของอันตรายที่มีอัตราที่แตกต่างกันของการยึดเกาะที่ขึ้นอยู่กับการปรากฏตัวของเดี่ยวSNP. มีหลายเรื่องในการศึกษา GWAS ที่มีความซับซ้อนมากขึ้นกว่าในมาตรฐานการถดถอยเชิงเส้น. ครั้งแรกของทั้งหมดเป็นจำนวนของ SNPs (เมตร) เมื่อเทียบกับจำนวนของสายพันธุ์ทดสอบ (ที่นี่, n = 38) มีการแก้ไขให้ถูกต้องสำหรับการทดสอบหลายๆ หากเกณฑ์มาตรฐานอย่างมีนัยสำคัญ 5% ต่อ
การแปล กรุณารอสักครู่..

เลขที่ : nc_002695 ) และขนาดของพลาสมิด po157 ( เลขที่ : ภาคยานุวัติ
nc_002128 ) โดยใช้เครื่องมือการสร้างสรรค์ ( หลี่ และ เดอร์บิน , 2010 )
samtools แพคเกจซอฟต์แวร์แปลงไฟล์รูปแบบรูปแบบแบม
แซมและจัดเรียงไฟล์แบม ( Li et al . , 2009 ) samtools mpileup
สร้างไฟล์รูปแบบและ bcftools BCF ถูกใช้เรียก snps ( ระหว่าง
อ้างอิงและตัวอย่าง ) ในรูปแบบเพื่อ .snps ถูกกรองด้วย
คุณภาพเกณฑ์ไว้ที่ความลึกอ่านอย่างน้อยห้า SNP ข้อมูล
ถูกเปลี่ยนเพื่อไบนารี 0 / 1 , ข้อมูล เว็บไซต์เหล่านั้นซึ่ง SNP เป็น
ระบุใน STEC สายพันธุ์ ( สายพันธุ์ที่ศึกษาการทดสอบ ) เทียบกับ
ซาไก ( สายพันธุ์อ้างอิง ) ได้รับ 1 0 ถูกวางไว้ตาม
นิวคลีโอไทด์เหมือนกันในจีโนมของการทดสอบแต่ละสายพันธุ์เมื่อเทียบกับ
อ้างอิงเมื่อยซาไก .นี้ส่งผลในการไบนารีโดย N เมทริกซ์ที่ M
เป็นจำนวน snps และจำนวนสายพันธุ์ที่ทดสอบ ( n = 38 ) .
2.4 . ข้อมูลฟีโนไทป์
กาว คุณสมบัติของมนุษย์ในเซลล์ซึ่งใช้
พร็อกซี่สำหรับความรุนแรงในการศึกษานี้ รวม 18 คน แยกเป็นสมาชิก
( h-numbers ) และ 20 สัตว์สายพันธุ์ ( เป็นสมาชิก a-numbers ) จาก Lineage
ฉันI / II และ II ( ดู ตารางที่ 1 สำหรับคุณสมบัติของสายพันธุ์ ) ทำการ
เปรียบเทียบ ความแตกต่าง caco-2 เซลล์ถูกใช้เป็นระบบรูปแบบตัวแทน
สำหรับมนุษย์ในเซลล์ พวกเขามีการผลิตถือว่า
และเมล็ดเป็นก่อนหน้านี้อธิบายโดย Oliveira et al . ( 2011 ) สำหรับการยึดติด
การทดลองเซลล์ถูก seeded ใน 12 คือจานที่สมาธิ
1.6 × 105 เซลล์ / ดีSTEC เป็นเชื้อแต่ละสายพันธุ์ใน BHI broth บ่มค้างคืน
( บน ) ที่อุณหภูมิ 37 องศา C ได้รับวัฒนธรรมประกอบด้วย
ประมาณ 109 CFU / มล. และสามวิธีการทศนิยม
ส่งผลให้ BBL ช่วงล่างของแต่ละสายพันธุ์ประมาณ
106 cfu / ml ได้ จากเส้นสุดท้ายเหล่านี้ caco-2 เซลล์
ดีแผ่นปลูกเชื้อด้วย 40 μผมต่อก็ต่อ STEC สายพันธุ์หก
เวลส์จานอยู่ระดับ ( 1 นาทีที่× 175 กรัม ) บ่มที่ 37 ° C ใน humidified
บรรยากาศอากาศ CO2 95% และ 5% สำหรับ 1 h .
หลังจากบ่มและสาม washings กับก่อนอุ่นเป็นหมัน
ฟอสเฟตบัฟเฟอร์น้ำเกลือ ( PBS ) 1 ml 1 % triton-x100 ใน PBS ( prewarmed )
ถูกเพิ่มเข้าไป กันเพื่อแยกเซลล์ ภายในเซลล์ครั้งนี้
3 บ่อ และเนื้อหาของจำนวนรวมวิธีการทศนิยมถูกเตรียมในเปปโตนสรีรวิทยา
สารละลายเกลือ และเจือจางเป็นประกาย™ชุบใน E . coli /
โคลิฟอร์ม ( oxoid บั๊ดโฮเวอดอร์ป , เลือก , เนเธอร์แลนด์ ) .
3 การวิเคราะห์ข้อมูลเชิงสถิติ
3.1 . ข้อมูลฟีโนไทป์
การคำนวณโดยการหารเศษส่วนจํานวน
stecs หลังจากการทดสอบการยึดเกาะ โดยจำนวน stecs เพิ่ม
เซลล์ caco-2 .ถ้าเซลล์จะถือว่ามีการกระจายเป็นเนื้อเดียวกันใน
วัฒนธรรมแล้วจํานวนเซลล์นับต่อเจือจางเป็นปัวซอ
กระจายที่มีพารามิเตอร์λ . ตามสมมติฐานนี้ ประมาณการ
สำหรับλ , คาดว่าจะได้จำนวนเซลล์ในตัวอย่าง สามารถประมาณได้จากการนับในอนุกรม
วิธีการตัวอย่างเดิมตาม
ผม¼∑ K J
ผม
ผม¼∑ K J
10 −ผม
,โดยที่ n คือ จํานวนนับใน ith เจือจาง ประมาณการ
จุดสำหรับเศษส่วนของแบคทีเรียที่ติดมากับ caco-2 เซลล์เป็น 2
λλ 1
, ที่λ 1 คือ คาดว่าจำนวนของแบคทีเรียใน
วัฒนธรรมค้างคืนและλ 2 คาดว่า จำนวนของแบคทีเรียที่ติดมากับเซลล์ caco-2 .
2 . การถดถอยเชิงเส้นอย่างง่าย
แนวคิดพื้นฐานในการศึกษานี้คือ เพื่อระบุ snps ในสายพันธุ์ทดสอบ
ที่อาจจะเกี่ยวข้องกับการเพิ่มขึ้นของโรคพฤติกรรม ( แสดงโดย caco-2
ค่อนข้างสูงเมื่อเทียบกับเซลล์แนบเศษส่วน
สายพันธุ์ทดสอบอื่น ๆโดยไม่ snps เหล่านี้ ) .
ความแข็งแรงของสมาคมนี้สามารถในรูปแบบพื้นฐานที่สุด คือประมาณ
ใช้ง่ายต่อไปนี้การถดถอยเชิงเส้นแบบแต่ละ HR :
อี¼μþบีตาซีþε I ;
whereyi เป็นเศษส่วน caco-2 ยึดติดสำหรับสายพันธุ์ผมμคือหมายถึง
ตอบสนอง บีตาเป็น SNP ผล Xi เป็นตัวแปรบ่งชี้กับ
ซี¼ 0 ถ้าเครื่องหมายที่นี่ðÞ ; คะแนนของการทดสอบความเครียดฉัน SNP เท่ากับสายพันธุ์อ้างอิง
1 มิฉะนั้น ;
และข้อผิดพลาดที่เหลือεผมมีการแจกแจงปกติ ความอิสระกับ
σ E
2
.
สำหรับแต่ละ SNP ที่ H0 สมมติฐานโมฆะ : บีตา = 0 คือการทดสอบกับสมมติฐานทางเลือก
: ฮาบีตา≠ 0 และบีตา p-values และผลคำนวณ
และเปลี่ยนเป็น− LN ขนาด .
ในสมาคมการศึกษา ( กว้าง ) gwas ) ทดสอบที่สอดคล้องกัน
ใช้ทั้งหมดเครื่องหมาย ในแง่ของการบ่งชี้ถึงอันตรายนี้ง่าย
แบบได้กำหนดสายพันธุ์หนึ่งสองระดับอันตราย
มีอัตราที่แตกต่างกันของการยึดติด ขึ้นอยู่กับสถานะของ SNP เดี่ยว
มีหลายประเด็นใน gwas การศึกษาที่ซับซ้อน
กว่าในการถดถอยเชิงเส้นมาตรฐาน ครั้งแรกของทั้งหมด เป็นจำนวน snps
( M ) เมื่อเทียบกับจำนวนของสายพันธุ์ที่ทดสอบ ( ที่นี่ , N = 38 ) หนึ่ง
ที่ถูกต้องสำหรับการทดสอบหลาย ถ้ากำหนดเกณฑ์มาตรฐานร้อยละ 5 ต่อ
การแปล กรุณารอสักครู่..
