The amount of high-throughput scree

The amount of high-throughput screening (HTS) data readily available has signiﬁcantly increased
because of the PubChem project (http://pubchem.ncbi.nlm.nih.gov/). There is considerable opportunity
for datamining of smallmolecules for a variety of biological systems using cheminformatic tools and the
resources available through PubChem. In thiswork,we trained a support vectormachine (SVM) classiﬁer
using the Signature molecular descriptor on factor XIa inhibitor HTS data. The optimal number of
Signatures was selected by implementing a feature selection algorithm of highly correlated clusters. Our
method included an improvement that allowed clusters to work together for accuracy improvement,
where previous methods have scored clusters on an individual basis. The resulting model had a 10-fold
cross-validation accuracy of 89%, and additional validation was provided by two independent test sets.
We applied the SVMto rapidly predict activity for approximately 12million compounds also deposited in
PubChem. Conﬁdence in these predictions was assessed by considering the number of Signatures within
the training set range for a given compound, deﬁned as the overlap metric. To further evaluate
compounds identiﬁed as active by the SVM, docking studies were performed using AutoDock. A focused
database of compounds predicted to be active was obtained with several of the compounds appreciably
dissimilar to those used in training the SVM. This focused database is suitable for further study. The data
mining technique presented here is not speciﬁc to factor XIa inhibitors, and could be applied to other
bioassays in PubChemwhere one is looking to expand the search for smallmolecules as chemical probes.

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

อัตราความเร็วสูง (เมอร์) การคัดกรองข้อมูลพร้อมมี signiﬁcantly เพิ่ม
เนื่องจากโครงการผับเคม (http://pubchem.ncbi.nlm.nih.gov/) มีโอกาสมาก
สำหรับ datamining smallmolecules สำหรับระบบชีวภาพโดยใช้เครื่องมือ cheminformatic และ
ทรัพยากรผ่านผับเคม ใน thisworkเราฝึกอบรมการสนับสนุน vectormachine (SVM) classiﬁer
ใช้อธิบายโมเลกุลของลายเซ็นบนปัจจัยข้อมูลเมอร์ผลเซียะ สูงสุดจำนวน
เลือกลายเซ็น โดยใช้ขั้นตอนวิธีการเลือกคุณลักษณะของคลัสเตอร์ correlated สูง ของเรา
วิธีรวมการปรับปรุงที่ได้รับอนุญาตคลัสเตอร์ทำงานร่วมกันปรับปรุงความถูกต้อง,
ซึ่งวิธีการก่อนหน้านี้มีคะแนนคลัสเตอร์บนพื้นฐานเป็นรายบุคคล รูปผลมีกลีบ 10
ข้ามตรวจสอบความถูกต้องของ 89% และตรวจสอบเพิ่มเติมให้ ด้วยสองทดสอบอิสระชุด.
เราใช้ SVMto การอย่างรวดเร็วทำนายกิจกรรมสำหรับประมาณ 12million สารยังฝากใน
ผับเคม Conﬁdence ในการคาดการณ์เหล่านี้ถูกประเมิน โดยพิจารณาจำนวนลายเซ็นภายใน
การฝึกกำหนดช่วงสำหรับ deﬁned ผสม ที่กำหนดเป็นเมตริกซ้อน การประเมินเพิ่มเติม
สาร identiﬁed ใช้งาน โดย SVM เทียบศึกษาได้ดำเนินการโดยใช้ AutoDock การเน้น
ฐานข้อมูลสารที่คาดว่า จะเป็นงานได้รับ ด้วยสารประกอบ appreciably
ไม่เหมือนกับที่ใช้ในการฝึกอบรมการ SVM ฐานข้อมูลนี้โฟกัสเหมาะสำหรับการศึกษาต่อ ข้อมูล
นำเสนอเทคนิคการทำเหมืองไม่ speciﬁc ปัจจัยเซี่ย inhibitors และสามารถใช้กับอื่น ๆ
bioassays ใน PubChemwhere หนึ่งที่กำลังมองหาสำหรับ smallmolecules เป็น probes เคมี

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

ปริมาณของการตรวจคัดกรองผ่านสูง (HTS) ข้อมูลที่พร้อมใช้งานได้อย่างมีนัยสำคัญเพิ่มขึ้น
เพราะโครงการ PubChem (http://pubchem.ncbi.nlm.nih.gov/) มีโอกาสมากที่
การทำเหมืองข้อมูลของ smallmolecules สำหรับความหลากหลายของระบบชีวภาพโดยใช้เครื่องมือ cheminformatic และ
ทรัพยากรที่มีอยู่ผ่าน PubChem ใน thiswork เราได้รับการฝึกฝน vectormachine สนับสนุน (SVM) จัดประเภทเอ้อ
ใช้ลายเซ็นอธิบายโมเลกุลกับปัจจัยข้อมูลเซี่ยยับยั้ง HTS จำนวนที่เหมาะสมของ
ลายเซ็นได้รับเลือกจากการดำเนินการขั้นตอนวิธีการเลือกคุณลักษณะของกลุ่มมีความสัมพันธ์อย่างมาก ของเรา
วิธีการรวมถึงการปรับปรุงที่ได้รับอนุญาตกลุ่มที่จะทำงานร่วมกันในการปรับปรุงความถูกต้อง
ที่วิธีการก่อนหน้านี้ได้คะแนนกลุ่มเป็นรายบุคคล รูปแบบที่เกิดขึ้นมี 10 เท่า
ความถูกต้องข้ามการตรวจสอบจาก 89% และการตรวจสอบเพิ่มเติมได้โดยสองชุดทดสอบอิสระ
เราใช้ SVMto อย่างรวดเร็วทำนายกิจกรรมประมาณ 12 ล้านสารประกอบยังฝากไว้ใน
PubChem เชื่อ con ไฟในการคาดการณ์เหล่านี้ได้รับการประเมินโดยพิจารณาจำนวนของลายเซ็นที่อยู่ใน
ช่วงการฝึกอบรมชุดสำหรับสารประกอบเดอไฟให้ ned เป็นตัวชี้วัดที่ทับซ้อนกัน เพื่อประเมิน
การระบุสารประกอบเอ็ดไฟเป็นที่ใช้งานโดย SVM ศึกษาต่อได้รับการดำเนินการโดยใช้ AutoDock เน้น
ฐานข้อมูลของสารที่คาดว่าจะเป็นที่ใช้งานได้กับหลายของสารประกอบประเมิน
ที่แตกต่างกันกับที่ใช้ในการฝึกอบรม SVM ฐานข้อมูลที่เน้นการนี้เหมาะสำหรับการศึกษาต่อ ข้อมูล
เทคนิคการทำเหมืองแร่ที่นำเสนอนี้ไม่ได้ไฟค speci ปัจจัยยับยั้งเซี่ยและสามารถนำไปใช้กับคนอื่น ๆ
การทดลองทางชีววิทยาใน PubChemwhere หนึ่งกำลังมองหาที่จะขยายการค้นหา smallmolecules เป็น probe เคมี

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

ปริมาณของการช่วย ( HTS ) ข้อมูลพร้อมใช้งานได้ signi จึงลดลงอย่างมีนัยสําคัญเมื่อเพิ่มขึ้น
เพราะโครงการ ( ( http : / / ( . ncbi . nlm . NIH . gov / ) มี โอกาสมากสำหรับดาต้าไมนิ่งของ
smallmolecules สำหรับความหลากหลายของระบบชีวภาพ การใช้เครื่องมือและทรัพยากรที่พร้อมใช้งานผ่าน cheminformatic
( . thiswork ใน ,เราได้รับการสนับสนุน vectormachine ( SVM ) classi จึงเอ้อ
ใช้ลายเซ็นโมเลกุลหัวเรื่องปัจจัยข้อมูลเซี่ยซิน hts . จำนวนที่เหมาะสมของ
ลายเซ็นถูกเลือกโดยการใช้คุณลักษณะการใช้ระดับสูงกลุ่ม วิธีของเรา
รวมการปรับปรุงที่อนุญาตให้กลุ่ม ทำงานร่วมกันเพื่อปรับปรุงความถูกต้อง
ซึ่งวิธีการก่อนหน้านี้ได้คะแนนกลุ่มในแต่ละบุคคล ส่งผลให้รูปแบบมี 10 เท่า
ข้ามการตรวจสอบความถูกต้องของ 89% และตรวจสอบเพิ่มเติม โดยชุดทดสอบอิสระ .
เราใช้ svmto อย่างรวดเร็วทำนายกิจกรรมประมาณ 12million สารประกอบยังฝากไว้
( .คอน จึง dence ในการคาดการณ์เหล่านี้ได้รับการประเมินโดยพิจารณาจำนวนลายเซ็นภายใน
ช่วงชุดฝึกอบรมสำหรับการผสม , de จึงเน็ดเป็นซ้อนเมตริก เพื่อประเมินสารประกอบเพิ่มเติม
identi จึงเอ็ดเป็น active โดย SVM docking , ศึกษาการใช้ autodock . เน้น
ฐานข้อมูลของสารประกอบที่คาดการณ์จะใช้งานได้กับหลายของสารประกอบที่ได้
ที่แตกต่างกันที่ใช้ในการฝึกอบรม SVM . ฐานข้อมูลนี้จึงเหมาะสำหรับการศึกษาต่อไป ข้อมูล วิธีการทําเหมือง
แสดงที่นี่ไม่ใช่กาจึง C ปัจจัยเซี่ยน และสามารถใช้กับละเอียดอื่น ๆใน pubchemwhere
หนึ่งต้องการขยายการค้นหา smallmolecules เป็นสารเคมีเครื่องมือตรวจสอบ

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.