AbstractThe Protein Data Bank (PDB; http://www.rcsb.org/pdb/ ) is the  การแปล - AbstractThe Protein Data Bank (PDB; http://www.rcsb.org/pdb/ ) is the  ไทย วิธีการพูด

AbstractThe Protein Data Bank (PDB;

Abstract

The Protein Data Bank (PDB; http://www.rcsb.org/pdb/ ) is the single worldwide archive of structural data of biological macromolecules. This paper describes the goals of the PDB, the systems in place for data deposition and access, how to obtain further information, and near-term plans for the future development of the resource.

Previous Section
Next Section
Received September 20, 1999; Revised and Accepted October 17, 1999.

Previous Section
Next Section
INTRODUCTION

The Protein Data Bank (PDB) was established at Brookhaven National Laboratories (BNL) (1) in 1971 as an archive for biological macromolecular crystal structures. In the beginning the archive held seven structures, and with each year a handful more were deposited. In the 1980s the number of deposited structures began to increase dramatically. This was due to the improved technology for all aspects of the crystallographic process, the addition of structures determined by nuclear magnetic resonance (NMR) methods, and changes in the community views about data sharing. By the early 1990s the majority of journals required a PDB accession code and at least one funding agency (National Institute of General Medical Sciences) adopted the guidelines published by the International Union of Crystallography (IUCr) requiring data deposition for all structures.

The mode of access to PDB data has changed over the years as a result of improved technology, notably the availability of the WWW replacing distribution solely via magnetic media. Further, the need to analyze diverse data sets required the development of modern data management systems.

Initial use of the PDB had been limited to a small group of experts involved in structural research. Today depositors to the PDB have varying expertise in the techniques of X-ray crystal structure determination, NMR, cryoelectron microscopy and theoretical modeling. Users are a very diverse group of researchers in biology, chemistry and computer scientists, educators, and students at all levels. The tremendous influx of data soon to be fueled by the structural genomics initiative, and the increased recognition of the value of the data toward understanding biological function, demand new ways to collect, organize and distribute the data.

In October 1998, the management of the PDB became the responsibility of the Research Collaboratory for Structural Bioinformatics (RCSB). In general terms, the vision of the RCSB is to create a resource based on the most modern technology that facilitates the use and analysis of structural data and thus creates an enabling resource for biological research. Specifically in this paper, we describe the current procedures for data deposition, data processing and data distribution of PDB data by the RCSB. In addition, we address the issues of data uniformity. We conclude with some current developments of the PDB.

Previous Section
Next Section
DATA ACQUISITION AND PROCESSING

A key component of creating the public archive of information is the efficient capture and curation of the data—data processing. Data processing consists of data deposition, annotation and validation. These steps are part of the fully documented and integrated data processing system shown in Figure 1.

Figure
View larger version:
In this page In a new window
Download as PowerPoint Slide
Figure 1. The steps in PDB data processing. Ellipses represent actions and rectangles define content.

In the present system (Fig. 2), data (atomic coordinates, structure factors and NMR restraints) may be submitted via email or via the AutoDep Input Tool (ADIT; http://pdb.rutgers. edu/adit/ ) developed by the RCSB. ADIT, which is also used to process the entries, is built on top of the mmCIF dictionary which is an ontology of 1700 terms that define the macro­molecular structure and the crystallographic experiment (2,3), and a data processing program called MAXIT (MAcromolecular EXchange Input Tool). This integrated system helps to ensure that the data submitted are consistent with the mmCIF dictionary which defines data types, enumerates ranges of allowable values where possible and describes allowable relationships between data values.

Figure
View larger version:
In this page In a new window
Download as PowerPoint Slide
Figure 2. The integrated tools of the PDB data processing system.

After a structure has been deposited using ADIT, a PDB identifier is sent to the author automatically and immediately (Fig. 1, Step 1). This is the first stage in which information about the structure is loaded into the internal core database (see section on the PDB Database Resource). The entry is then annotated as described in the validation section below. This process involves using ADIT to help diagnose errors or inconsistencies in the files. The completely annotated entry as it will appear in the PDB resource, together with the validation information, is sent back to the depositor (Step 2). After reviewing the processed file, the author sends any revisions (Step 3). Depending on the nature of these revisions, Steps 2 and 3 may be repeated. Once approval is received from the author (Step 4), the entry and the tables in the internal core database are ready for distribution. The schema of this core database is a subset of the conceptual schema specified by the mmCIF dictionary.

All aspects of data processing, including communications with the author, are recorded and stored in the correspondence archive. This makes it possible for the PDB staff to retrieve information about any aspect of the deposition process and to closely monitor the efficiency of PDB operations.

Current status information, comprised of a list of authors, title and release category, is stored for each entry in the core database and is made accessible for query via the WWW interface (http://www.rcsb.org/pdb/status.html ). Entries before release are categorized as ‘in processing’ (PROC), ‘in depositor review’ (WAIT), ‘to be held until publication’ (HPUB) or ‘on hold until a depositor-specified date’ (HOLD).

Content of the data collected by the PDB
All the data collected from depositors by the PDB are considered primary data. Primary data contain, in addition to the coordinates, general information required for all deposited structures and information specific to the method of structure determination. Table 1 contains the general information that the PDB collects for all structures as well as the additional information collected for those structures determined by X-ray methods. The additional items listed for the NMR structures are derived from the International Union of Pure and Applied Chemistry recommen­dations (IUPAC) (4) and will be implemented in the near future.

View this table:
In this window In a new window
Table 1.
Content of data in the PDB

The information content of data submitted by the depositor is likely to change as new methods for data collection, structure determination and refinement evolve and advance. In addition, the ways in which these data are captured are likely to change as the software for structure determination and refinement produce the necessary data items as part of their output. ADIT, the data input system for the PDB, has been designed so as to easily incorporate these likely changes.

Validation
Validation refers to the procedure for assessing the quality of deposited atomic models (structure validation) and for assessing how well these models fit the experimental data (experimental validation). The PDB validates structures using accepted community standards as part of ADIT’s integrated data processing system. The following checks are run and are summarized in a letter that is communicated directly to the depositor:

Covalent bond distances and angles. Proteins are compared against standard values from Engh and Huber (5); nucleic acid bases are compared against standard values from Clowney et al. (6); sugar and phosphates are compared against standard values from Gelbin et al. (7).

Stereochemical validation. All chiral centers of proteins and nucleic acids are checked for correct stereochemistry.

Atom nomenclature. The nomenclature of all atoms is checked for compliance with IUPAC standards (8) and is adjusted if necessary.

Close contacts. The distances between all atoms within the asymmetric unit of crystal structures and the unique molecule of NMR structures are calculated. For crystal structures, contacts between symmetry-related molecules are checked as well.

Ligand and atom nomenclature. Residue and atom nomen­clature is compared against the PDB dictionary (ftp://ftp.rcsb. org/pub/pdb/data/monomers/het_dictionary.txt ) for all ligands as well as standard residues and bases. Unrecognized ligand groups are flagged and any discrepancies in known ligands are listed as extra or missing atoms.

Sequence comparison. The sequence given in the PDB SEQRES records is compared against the sequence derived from the coordinate records. This information is displayed in a table where any differences or missing residues are marked. During structure processing, the sequence database references given by DBREF and SEQADV are checked for accuracy. If no reference is given, a BLAST (9) search is used to find the best match. Any conflict between the PDB SEQRES records and the sequence derived from the coordinate records is resolved by comparison with various sequence databases.

Distant waters. The distances between all water oxygen atoms and all polar atoms (oxygen and nitrogen) of the macromolecules, ligands and solvent in the asymmetric unit are calculated. Distant solvent atoms are repositioned using crystallographic symmetry such that they fall within the solvation sphere of the macromolecule.

In almost all cases, serious errors detected by these checks are corrected through annotation and correspondence with the authors.

It is also possible to run these validation checks against structures before they are deposited. A validation s
0/5000
จาก: -
เป็น: -
ผลลัพธ์ (ไทย) 1: [สำเนา]
คัดลอก!
บทคัดย่อธนาคารข้อมูลโปรตีน (PDB; http://www.rcsb.org/pdb/) คือ การเก็บถาวรทั่วโลกเดียวของข้อมูลโครงสร้างของ macromolecules ทางชีวภาพ เอกสารนี้อธิบายเป้าหมายของ PDB ระบบที่การสะสมข้อมูลเข้า การรับการเพิ่มเติมข้อมูล และ near-term แผนสำหรับอนาคตของทรัพยากรส่วนก่อนหน้านี้ส่วนถัดไป20 กันยายน 1999 ได้รับ ยอมรับ และปรับปรุง 17 ตุลาคม 1999ส่วนก่อนหน้านี้ส่วนถัดไปแนะนำการโปรตีนข้อมูลธนาคาร (PDB) ถูกตั้งขึ้นที่ Brookhaven ชาติปฏิบัติ (BNL) (1) ในปี 1971 เป็นเก็บถาวรสำหรับโครงสร้างผลึก macromolecular ชีวภาพ ในการเริ่มต้นเก็บถาวรจัดโครงสร้าง 7 และแต่ละปีได้หยิบ เพิ่มเติมก็ฝาก ในทศวรรษ 1980 จำนวนโครงสร้างนำฝากเริ่มเพิ่มขึ้นอย่างมาก ซึ่งเกิดจากเทคโนโลยีดีขึ้นทุก ๆ การ crystallographic นอกจากนี้โครงสร้างที่กำหนด โดยวิธีการสั่นพ้องแม่เหล็กนิวเคลียร์ (NMR) และการเปลี่ยนแปลงในมุมมองของชุมชนเกี่ยวกับการใช้ข้อมูลร่วมกัน โดยช่วงปี 1990 ส่วนใหญ่ของสมุดรายวันจำเป็นสำนักงานเงินทุนน้อย (ชาติสถาบันของทั่วไปวิทยาศาสตร์การแพทย์) และรหัสทะเบียน PDB นำแนวทางการเผยแพร่ โดยนานาชาติร่วมของผลิกศาสตร์ (IUCr) ต้องสะสมข้อมูลสำหรับโครงสร้างทั้งหมดมีการเปลี่ยนแปลงโหมดการเข้าถึงข้อมูล PDB ปีจากการปรับปรุงเทคโนโลยี ยวดพร้อมกระจายแทน WWW เท่านั้นผ่านสื่อแม่เหล็ก เพิ่มเติม ต้องวิเคราะห์ชุดข้อมูลมีความหลากหลายต้องการการพัฒนาระบบการจัดการข้อมูลที่ทันสมัยเริ่มต้นใช้ PDB ที่เคยจำกัดผู้เชี่ยวชาญที่เกี่ยวข้องในการวิจัยโครงสร้างขนาดเล็ก วันนี้ depositors เพื่อ PDB มีความเชี่ยวชาญแตกต่างกันในเทคนิคของการกำหนดโครงสร้างของผลึกเอ็กซ์เรย์ NMR, cryoelectron microscopy และแบบจำลองทฤษฎี ผู้ใช้คือ กลุ่มหลากหลายของนักวิจัย ในชีววิทยา เคมีและคอมพิวเตอร์นักวิทยาศาสตร์ นักการศึกษา นักศึกษาทุกระดับชั้น อีกมหาศาลข้อมูลเร็ว ๆ นี้จะสามารถเป็นเชื้อเพลิง โดยการริเริ่มโครงสร้าง genomics และการเพิ่มขึ้นของค่าของข้อมูลต่อการทำความเข้าใจฟังก์ชันชีวภาพ ต้องวิธีใหม่ในการรวบรวม จัดระเบียบ และกระจายข้อมูลในเดือน 2541 ตุลาคม จัดการ PDB กลายเป็น ความรับผิดชอบของงานวิจัย Collaboratory สำหรับโครงสร้าง Bioinformatics (RCSB) ในข้อตกลง วิสัยทัศน์ของการ RCSB คือการ สร้างทรัพยากรตามเทคโนโลยีทันสมัยที่อำนวยความสะดวกในการใช้และการวิเคราะห์โครงสร้างข้อมูล และสร้างทรัพยากรการเปิดใช้งานสำหรับการวิจัยทางชีวภาพดังนั้น โดยเฉพาะในเอกสารนี้ เราอธิบายขั้นตอนปัจจุบันสำหรับการสะสมข้อมูล ประมวลผลข้อมูล และการกระจายข้อมูลของข้อมูล PDB โดย RCSB นอกจากนั้น เราสามารถแก้ไขปัญหาของใจข้อมูล เราสรุป ด้วยบาง PDB พัฒนาปัจจุบันส่วนก่อนหน้านี้ส่วนถัดไปซื้อข้อมูลและประมวลผลส่วนประกอบที่สำคัญของการสร้างเก็บถาวรของสาธารณะของข้อมูลเป็นการจับภาพที่มีประสิทธิภาพและ curation ข้อมูล-การประมวลผลข้อมูล ประมวลผลข้อมูลประกอบด้วยข้อมูลสะสม คำอธิบาย และตรวจสอบ ขั้นตอนเหล่านี้เป็นส่วนหนึ่งของระบบประมวลผลข้อมูลแบบบูรณาการ และเอกสารทั้งหมดที่แสดงในรูปที่ 1รูปดูรูป:ในหน้านี้ในหน้าต่างใหม่ดาวน์โหลดเป็นภาพนิ่ง PowerPointรูปที่ 1 ขั้นตอนในการประมวลผลข้อมูล PDB รูปวงรีหมายถึงการดำเนินการ และสี่เหลี่ยมกำหนดเนื้อหาในปัจจุบันระบบ (Fig. 2), (พิกัดอะตอม โครงสร้างปัจจัย และ NMR restraints) ข้อมูลอาจส่งผ่าน ทางอีเมล์ หรือผ่าน ทางเครื่อง มือป้อน AutoDep (ADIT; http://pdb.rutgers. edu/adit /) โดย RCSB ได้ ADIT ซึ่งยังใช้การประมวลผลรายการ อยู่บนพจนานุกรม mmCIF ซึ่งเป็นภววิทยา 1700 เงื่อนไขที่กำหนดโครงสร้าง macromolecular และทดลอง crystallographic (2,3), และโปรแกรมประมวลผลข้อมูลเรียกว่า MAXIT (MAcromolecular แลกป้อนมือ) ระบบนี้รวมช่วยให้แน่ใจว่า ข้อมูลที่ส่งสอดคล้องกับพจนานุกรม mmCIF ซึ่งกำหนดชนิดข้อมูล ระบุช่วงของค่าที่อนุญาตได้ และอธิบายความสัมพันธ์ได้ระหว่างค่าข้อมูลรูปดูรูป:ในหน้านี้ในหน้าต่างใหม่ดาวน์โหลดเป็นภาพนิ่ง PowerPointรูปที่ 2 เครื่องมือรวมของระบบประมวลผลข้อมูล PDBหลังจากที่ได้รับฝากไว้เป็นโครงสร้างใช้ ADIT รหัส PDB ถูกส่งไปยังผู้เขียนทันที และโดยอัตโนมัติ (Fig. 1 ขั้นตอนที่ 1) โดยระยะแรกที่โหลดข้อมูลเกี่ยวกับโครงสร้างในฐานข้อมูลหลักภายใน (ดูส่วนบนทรัพยากรฐานข้อมูล PDB) รายการจะใส่คำอธิบายประกอบแล้วตามที่อธิบายไว้ในส่วนการตรวจสอบด้านล่าง กระบวนการนี้เกี่ยวข้องกับการใช้ ADIT เพื่อช่วยวินิจฉัยข้อผิดพลาดหรือไม่สอดคล้องกันในแฟ้ม รายการประกอบอย่างสมบูรณ์ ตามที่จะปรากฏในทรัพยากร PDB พร้อมกับตรวจสอบข้อมูล ถูกส่งกลับไปฝาก (ขั้นตอนที่ 2) หลังจากตรวจทานแฟ้มประมวลผล ผู้ส่งแก้ไขใด ๆ (ขั้นตอนที่ 3) ตามธรรมชาติของการปรับปรุงเหล่านี้ ขั้นตอนที่ 2 และ 3 อาจทำซ้ำ เมื่อได้รับอนุมัติจากผู้เขียน (ขั้นตอนที่ 4), รายการและตารางในฐานข้อมูลหลักภายในพร้อมสำหรับการแจกจ่าย Schema ของฐานข้อมูลหลักนี้เป็นเซตย่อยของแบบแผนแนวคิดตามพจนานุกรม mmCIFทุกแง่มุมของการประมวลผลข้อมูล รวมถึงการติดต่อสื่อสารกับผู้เขียน บันทึก และเก็บไว้ในเก็บถาวรที่มีการโต้ตอบ นี้ทำให้ได้พนักงาน PDB เพื่อดึงข้อมูลเกี่ยวกับส่วนหนึ่งส่วนใดของกระบวนการสะสม และ การตรวจสอบประสิทธิภาพของการดำเนินงาน PDB อย่างใกล้ชิดCurrent status information, comprised of a list of authors, title and release category, is stored for each entry in the core database and is made accessible for query via the WWW interface (http://www.rcsb.org/pdb/status.html ). Entries before release are categorized as ‘in processing’ (PROC), ‘in depositor review’ (WAIT), ‘to be held until publication’ (HPUB) or ‘on hold until a depositor-specified date’ (HOLD).Content of the data collected by the PDBAll the data collected from depositors by the PDB are considered primary data. Primary data contain, in addition to the coordinates, general information required for all deposited structures and information specific to the method of structure determination. Table 1 contains the general information that the PDB collects for all structures as well as the additional information collected for those structures determined by X-ray methods. The additional items listed for the NMR structures are derived from the International Union of Pure and Applied Chemistry recommen­dations (IUPAC) (4) and will be implemented in the near future.View this table:In this window In a new windowTable 1.Content of data in the PDBThe information content of data submitted by the depositor is likely to change as new methods for data collection, structure determination and refinement evolve and advance. In addition, the ways in which these data are captured are likely to change as the software for structure determination and refinement produce the necessary data items as part of their output. ADIT, the data input system for the PDB, has been designed so as to easily incorporate these likely changes.ValidationValidation refers to the procedure for assessing the quality of deposited atomic models (structure validation) and for assessing how well these models fit the experimental data (experimental validation). The PDB validates structures using accepted community standards as part of ADIT’s integrated data processing system. The following checks are run and are summarized in a letter that is communicated directly to the depositor:Covalent bond distances and angles. Proteins are compared against standard values from Engh and Huber (5); nucleic acid bases are compared against standard values from Clowney et al. (6); sugar and phosphates are compared against standard values from Gelbin et al. (7).Stereochemical validation. All chiral centers of proteins and nucleic acids are checked for correct stereochemistry.Atom nomenclature. The nomenclature of all atoms is checked for compliance with IUPAC standards (8) and is adjusted if necessary.Close contacts. The distances between all atoms within the asymmetric unit of crystal structures and the unique molecule of NMR structures are calculated. For crystal structures, contacts between symmetry-related molecules are checked as well.Ligand and atom nomenclature. Residue and atom nomen­clature is compared against the PDB dictionary (ftp://ftp.rcsb. org/pub/pdb/data/monomers/het_dictionary.txt ) for all ligands as well as standard residues and bases. Unrecognized ligand groups are flagged and any discrepancies in known ligands are listed as extra or missing atoms.Sequence comparison. The sequence given in the PDB SEQRES records is compared against the sequence derived from the coordinate records. This information is displayed in a table where any differences or missing residues are marked. During structure processing, the sequence database references given by DBREF and SEQADV are checked for accuracy. If no reference is given, a BLAST (9) search is used to find the best match. Any conflict between the PDB SEQRES records and the sequence derived from the coordinate records is resolved by comparison with various sequence databases.Distant waters. The distances between all water oxygen atoms and all polar atoms (oxygen and nitrogen) of the macromolecules, ligands and solvent in the asymmetric unit are calculated. Distant solvent atoms are repositioned using crystallographic symmetry such that they fall within the solvation sphere of the macromolecule.
In almost all cases, serious errors detected by these checks are corrected through annotation and correspondence with the authors.

It is also possible to run these validation checks against structures before they are deposited. A validation s
การแปล กรุณารอสักครู่..
ผลลัพธ์ (ไทย) 2:[สำเนา]
คัดลอก!
บทคัดย่อธนาคารข้อมูลโปรตีน (PDB; http://www.rcsb.org/pdb/) เป็นเก็บทั่วโลกเดียวของข้อมูลโครงสร้างของโมเลกุลทางชีวภาพ กระดาษนี้จะอธิบายเป้าหมายของ PDB ระบบในสถานที่สำหรับการสะสมข้อมูลและการเข้าถึงวิธีการที่จะได้รับข้อมูลเพิ่มเติมและแผนในระยะใกล้การพัฒนาในอนาคตของทรัพยากร. ก่อนหน้ามาตรามาตราถัดไปได้รับ20 กันยายน 1999; ปรับปรุงและได้รับการยืนยันวันที่ 17 ตุลาคมปี 1999 ก่อนหน้ามาตราถัดไปมาตราบทนำธนาคารข้อมูลโปรตีน(PDB) ได้ก่อตั้งขึ้นที่ Brookhaven ห้องปฏิบัติการแห่งชาติ (BNL) (1) ในปี 1971 เป็นที่เก็บสำหรับทางชีวภาพโครงสร้างผลึกโมเลกุล ในการเริ่มต้นเก็บเจ็ดจัดโครงสร้างและในแต่ละปีไม่กี่คนมีเงินมากขึ้น ในช่วงปี 1980 จำนวนของโครงสร้างฝากเริ่มที่จะเพิ่มขึ้นอย่างรวดเร็ว เนื่องจากเทคโนโลยีที่ดีขึ้นสำหรับทุกด้านของกระบวนการ crystallographic นอกเหนือจากโครงสร้างที่กำหนดโดยแม่เหล็กนิวเคลียร์ (NMR) วิธีการและการเปลี่ยนแปลงในมุมมองของชุมชนเกี่ยวกับการใช้ข้อมูลร่วมกัน โดยช่วงปี 1990 ส่วนใหญ่ของวารสารต้องมีรหัสเข้า PDB และอย่างน้อยหนึ่งหน่วยงานระดมทุน (National Institute of วิทยาศาสตร์การแพทย์ทั่วไป) นำมาใช้แนวทางที่เผยแพร่โดยสหภาพนานาชาติของผลึก (IUCr) ต้องมีการสะสมข้อมูลสำหรับโครงสร้างทั้งหมด. โหมดของ การเข้าถึงข้อมูล PDB มีการเปลี่ยนแปลงในช่วงหลายปีเป็นผลมาจากเทคโนโลยีที่ดีขึ้นโดยเฉพาะความพร้อมของการจัดจำหน่าย แต่เพียงผู้เดียวรายละเอียดการเปลี่ยนผ่านทางสื่อแม่เหล็ก นอกจากนี้จำเป็นที่จะต้องวิเคราะห์ชุดข้อมูลที่หลากหลายต้องพัฒนาระบบการจัดการข้อมูลที่ทันสมัย. การใช้งานครั้งแรกของ PDB ได้รับการ จำกัด ให้กลุ่มเล็ก ๆ ของผู้เชี่ยวชาญด้านการมีส่วนร่วมในการวิจัยโครงสร้าง ผู้ฝากเงินในวันนี้เพื่อ PDB ที่แตกต่างกันมีความเชี่ยวชาญในการเทคนิคของการกำหนดโครงสร้างผลึก X-ray NMR กล้องจุลทรรศน์ cryoelectron และการสร้างแบบจำลองทางทฤษฎี ผู้ใช้เป็นกลุ่มที่มีความหลากหลายมากของนักวิจัยในชีววิทยาเคมีและนักวิทยาศาสตร์คอมพิวเตอร์, การศึกษา, และนักเรียนในทุกระดับ ไหลบ่าเข้ามาอย่างมากของข้อมูลเร็ว ๆ นี้จะผลักดันจากความคิดริเริ่มของฟังก์ชั่นที่มีโครงสร้างและการรับรู้ที่เพิ่มขึ้นของค่าของข้อมูลที่มีต่อความเข้าใจในการทำงานทางชีวภาพที่มีความต้องการวิธีการใหม่ ๆ ในการเก็บรวบรวมจัดระเบียบและแจกจ่ายข้อมูล. ในเดือนตุลาคมปี 1998 การบริหารจัดการของ PDB กลายเป็นความรับผิดชอบของ Collaboratory วิจัยสำหรับชีวสารสนเทศศาสตร์โครงสร้าง (RCSB) ในแง่ทั่วไปวิสัยทัศน์ของ RCSB คือการสร้างทรัพยากรที่อยู่บนพื้นฐานของเทคโนโลยีที่ทันสมัยที่สุดที่อำนวยความสะดวกในการใช้งานและการวิเคราะห์ข้อมูลที่มีโครงสร้างและทำให้สร้างทรัพยากรการเปิดใช้งานสำหรับการวิจัยทางชีววิทยา โดยเฉพาะในบทความนี้เราจะอธิบายขั้นตอนปัจจุบันการสะสมข้อมูลการประมวลผลข้อมูลและการกระจายของข้อมูล PDB โดย RCSB นอกจากนี้เราแก้ไขปัญหาของความสม่ำเสมอของข้อมูล เราสรุปกับการพัฒนาในปัจจุบันของ PDB. ก่อนหน้ามาตราถัดไปมาตราการเก็บข้อมูลและการประมวลผลองค์ประกอบสำคัญของการสร้างเก็บข้อมูลต่อประชาชนคือการจับภาพที่มีประสิทธิภาพและcuration ของการประมวลผลข้อมูลข้อมูล การประมวลผลข้อมูลประกอบด้วยการสะสมข้อมูลบันทึกย่อและการตรวจสอบ ขั้นตอนเหล่านี้เป็นส่วนหนึ่งของการบันทึกไว้อย่างเต็มที่และบูรณาการระบบการประมวลผลข้อมูลที่แสดงให้เห็นในรูปที่ 1 รูปที่ดูรุ่นใหญ่: ในหน้านี้ในหน้าต่างใหม่ดาวน์โหลดเป็นภาพนิ่ง PowerPoint รูปที่ 1 ขั้นตอนในการประมวลผลข้อมูล PDB วงรีเป็นตัวแทนของการกระทำและการกำหนดเนื้อหาสี่เหลี่ยม. ในระบบปัจจุบัน (รูปที่ 2.) ข้อมูล (พิกัดอะตอมปัจจัยโครงสร้างและ restraints NMR) อาจจะถูกส่งผ่านทางอีเมล์หรือผ่านทางเครื่องมือการป้อนข้อมูล AutoDep (ADIT; http: //pdb.rutgers . edu / เข้าหา /) พัฒนาโดย RCSB ADIT ซึ่งจะใช้ในการประมวลผลรายการที่ถูกสร้างขึ้นที่ด้านบนของพจนานุกรม mmCIF ซึ่งเป็นอภิปรัชญา 1700 เงื่อนไขที่กำหนดโครงสร้างโมเลกุลและการทดลอง crystallographic (2,3) และโปรแกรมการประมวลผลข้อมูลที่เรียกว่า MAXIT (macromolecular เครื่องมือการป้อนข้อมูล Exchange) ระบบแบบบูรณาการช่วยให้มั่นใจว่าข้อมูลที่ส่งมีความสอดคล้องกับพจนานุกรม mmCIF ซึ่งได้กำหนดชนิดข้อมูลระบุช่วงของค่าที่อนุญาตที่เป็นไปได้และอธิบายถึงความสัมพันธ์ที่อนุญาตระหว่างค่าข้อมูล. รูปที่ดูรุ่นใหญ่: ในหน้านี้ในหน้าต่างใหม่ดาวน์โหลดเป็นภาพนิ่ง PowerPoint รูปที่ 2 เครื่องมือแบบบูรณาการของระบบการประมวลผลข้อมูล PDB. หลังจากโครงสร้างได้รับการฝากโดยใช้ ADIT, ตัวระบุ PDB ถูกส่งไปยังผู้เขียนโดยอัตโนมัติและทันที (รูปที่. 1 ขั้นตอนที่ 1) นี้เป็นขั้นตอนแรกในการที่ข้อมูลเกี่ยวกับโครงสร้างที่มีการโหลดลงในฐานข้อมูลหลักภายใน (ดูส่วนที่เกี่ยวกับฐานข้อมูลทรัพยากร PDB) รายการที่เป็นข้อเขียนแล้วตามที่อธิบายไว้ในส่วนการตรวจสอบด้านล่าง กระบวนการนี้เกี่ยวข้องกับการใช้ ADIT เพื่อช่วยวินิจฉัยข้อผิดพลาดหรือไม่สอดคล้องกันในไฟล์ รายการข้อเขียนสมบูรณ์ในขณะที่มันจะปรากฏในทรัพยากร PDB, พร้อมกับข้อมูลการตรวจสอบจะถูกส่งกลับไปยังผู้ฝากเงิน (ขั้นตอนที่ 2) หลังจากที่ตรวจสอบการประมวลผลไฟล์ที่ผู้เขียนส่งการแก้ไขใด ๆ (ขั้นตอนที่ 3) ขึ้นอยู่กับลักษณะของการแก้ไขเหล่านี้ขั้นตอนที่ 2 และ 3 อาจจะซ้ำแล้วซ้ำอีก เมื่อได้รับการอนุมัติจะได้รับจากผู้เขียน (ขั้นตอนที่ 4) รายการและตารางในฐานข้อมูลหลักภายในมีความพร้อมสำหรับการจัดจำหน่าย เค้าร่างของฐานข้อมูลหลักนี้เป็นส่วนหนึ่งของสคีแนวคิดที่ระบุโดยพจนานุกรม mmCIF. ทุกแง่มุมของการประมวลผลข้อมูลรวมถึงการสื่อสารกับผู้เขียนจะถูกบันทึกและเก็บไว้ในการเก็บจดหมาย นี้จะทำให้มันเป็นไปได้สำหรับพนักงาน PDB เพื่อดึงข้อมูลเกี่ยวกับลักษณะของกระบวนการสะสมใด ๆ และใกล้ชิดตรวจสอบประสิทธิภาพของการดำเนินงาน PDB ได้. ข้อมูลสถานะปัจจุบันประกอบด้วยรายชื่อของผู้เขียนชื่อและปล่อยประเภทจะถูกเก็บไว้สำหรับแต่ละรายการใน ฐานข้อมูลหลักและจะทำให้สามารถเข้าถึงสำหรับการค้นหาผ่านทางอินเตอร์เฟซที่ WWW (http://www.rcsb.org/pdb/status.html) รายการก่อนที่จะปล่อยมีการแบ่งประเภทเป็น 'ในการประมวลผล (PROC) ในการฝากเงินการตรวจสอบ (รอ)' ที่จะจัดขึ้นจนถึงสิ่งพิมพ์ (HPUB) หรือ 'ไว้จนกว่าวันที่ฝากเงินระบุ' (ถือ). เนื้อหาของ ข้อมูลที่เก็บรวบรวมโดย PDB ข้อมูลทั้งหมดที่รวบรวมจากผู้ฝากเงินโดย PDB จะถือว่าข้อมูลปฐมภูมิ ข้อมูลปฐมภูมิมีนอกเหนือไปจากพิกัดข้อมูลทั่วไปที่จำเป็นสำหรับโครงสร้างฝากทั้งหมดและข้อมูลที่เฉพาะเจาะจงกับวิธีการของการกำหนดโครงสร้าง ตารางที่ 1 มีข้อมูลทั่วไปที่ PDB เก็บสำหรับโครงสร้างทั้งหมดรวมทั้งข้อมูลเพิ่มเติมที่รวบรวมสำหรับโครงสร้างผู้กำหนดโดยวิธีการเอ็กซ์เรย์ รายการเพิ่มเติมที่ระบุไว้สำหรับโครงสร้าง NMR จะได้มาจากสหภาพนานาชาติของคำแนะนำเคมีบริสุทธิ์และประยุกต์ (IUPAC) (4) และจะดำเนินการในอนาคตอันใกล้. ดูตารางนี้: ในหน้าต่างนี้ในหน้าต่างใหม่ตารางที่ 1 เนื้อหา ของข้อมูลใน PDB เนื้อหาข้อมูลของข้อมูลที่ส่งมาจากผู้ฝากเงินมีแนวโน้มที่จะเปลี่ยนเป็นวิธีการใหม่ในการเก็บรวบรวมข้อมูลการกำหนดโครงสร้างและการปรับแต่งพัฒนาและล่วงหน้า นอกจากนี้วิธีการที่ข้อมูลเหล่านี้จะถูกจับมีแนวโน้มที่จะเปลี่ยนเป็นซอฟแวร์สำหรับการกำหนดโครงสร้างและการปรับแต่งการผลิตรายการข้อมูลที่จำเป็นเป็นส่วนหนึ่งของการส่งออกของพวกเขา ADIT ระบบการป้อนข้อมูลสำหรับ PDB ที่ได้รับการออกแบบมาเพื่อให้เป็นไปได้อย่างง่ายดายรวมการเปลี่ยนแปลงแนวโน้มเหล่านี้. ตรวจสอบการตรวจสอบหมายถึงขั้นตอนในการประเมินคุณภาพของฝากแบบจำลองอะตอม (การตรวจสอบโครงสร้าง) และสำหรับการประเมินวิธีการที่ดีรูปแบบเหล่านี้เหมาะสมกับการทดลอง ข้อมูล (การตรวจสอบจากการทดลอง) PDB ตรวจสอบโครงสร้างโดยใช้มาตรฐานของชุมชนได้รับการยอมรับว่าเป็นส่วนหนึ่งของระบบการประมวลผลข้อมูลแบบบูรณาการของ ADIT ตรวจสอบต่อไปนี้จะทำงานและมีรายละเอียดในจดหมายที่มีการสื่อสารโดยตรงกับผู้ฝากเงิน: โควาเลนระยะทางพันธบัตรและมุม โปรตีนจะถูกเปรียบเทียบกับค่ามาตรฐานจาก Engh และฮิว (5) ฐานกรดนิวคลีเมื่อเทียบกับค่ามาตรฐานจาก Clowney et al, (6); น้ำตาลและฟอสเฟตเมื่อเทียบกับค่ามาตรฐานจาก Gelbin et al, (7). การตรวจสอบ stereochemical ศูนย์ chiral ทั้งหมดของโปรตีนและกรดนิวคลีอิกจะถูกตรวจสอบสเตอริโอที่ถูกต้อง. ศัพท์ Atom ศัพท์ของอะตอมทั้งหมดจะถูกตรวจสอบการปฏิบัติตามมาตรฐาน IUPAC (8) และจะมีการปรับในกรณีที่จำเป็น. ปิดที่ติดต่อ ระยะทางระหว่างอะตอมทั้งหมดภายในหน่วยไม่สมดุลของโครงสร้างผลึกและโมเลกุลที่ไม่ซ้ำกันของโครงสร้าง NMR คำนวณ สำหรับโครงสร้างผลึกติดต่อระหว่างโมเลกุลสมมาตรที่เกี่ยวข้องจะถูกตรวจสอบเช่นกัน. แกนด์และการเรียกชื่ออะตอม สารตกค้างและการเรียกชื่ออะตอมเมื่อเทียบกับพจนานุกรม PDB (ftp:. //ftp.rcsb org / ผับ / PDB / ข้อมูล / โมโนเมอร์ / het_dictionary.txt) สำหรับแกนด์ทั้งหมดรวมทั้งสารตกค้างมาตรฐานและฐาน กลุ่มแกนด์ที่ไม่รู้จักมีค่าสถานะและความแตกต่างใด ๆ ในลิแกนด์ที่รู้จักกันมีการระบุไว้เป็นพิเศษหรืออะตอมที่ขาดหายไป. การเปรียบเทียบลำดับ ลำดับที่กำหนดในบันทึก PDB SEQRES เมื่อเทียบกับลำดับที่ได้มาจากการประสานงานการบันทึก ข้อมูลนี้จะแสดงในตารางที่แตกต่างใด ๆ หรือสารตกค้างที่หายไปมีการทำเครื่องหมาย ระหว่างการประมวลผลโครงสร้างอ้างอิงฐานข้อมูลลำดับที่กำหนดโดย DBREF SEQADV และมีการตรวจสอบความถูกต้อง ถ้าอ้างอิงไม่ได้รับการระเบิด (9) การค้นหาจะใช้ในการหาคู่ที่ดีที่สุด ความขัดแย้งใด ๆ ระหว่างการบันทึก PDB SEQRES และลำดับที่ได้มาจากการประสานงานการบันทึกได้รับการแก้ไขโดยการเปรียบเทียบกับฐานข้อมูลลำดับต่างๆ. น้ำทางไกล ระยะทางระหว่างอะตอมออกซิเจนน้ำและอะตอมขั้วโลกทั้งหมด (ออกซิเจนและไนโตรเจน) ของโมเลกุลที่แกนด์และตัวทำละลายในหน่วยไม่สมมาตรที่มีการคำนวณ อะตอมตัวทำละลายที่ห่างไกลได้รับการปรับเปลี่ยนโดยใช้สัดส่วน crystallographic เช่นที่พวกเขาตกอยู่ในวง solvation ของโมเลกุลได้. ในเกือบทุกกรณีความผิดพลาดร้ายแรงที่ตรวจพบโดยการตรวจสอบเหล่านี้ได้รับการแก้ไขผ่านคำอธิบายประกอบและการติดต่อกับผู้เขียน. นอกจากนี้ยังเป็นไปได้ที่จะใช้ตรวจสอบการตรวจสอบเหล่านี้ กับโครงสร้างก่อนที่พวกเขาจะฝาก s การตรวจสอบ










































































การแปล กรุณารอสักครู่..
ผลลัพธ์ (ไทย) 3:[สำเนา]
คัดลอก!
นามธรรม

ธนาคารข้อมูลโปรตีน ( PDB ; http://www.rcsb.org/pdb/ ) เป็นแฟ้มเดียวของข้อมูลโครงสร้างของโมเลกุลทั่วโลกแท้ๆ บทความนี้อธิบายถึงเป้าหมายของ PDB , ระบบในสถานที่สำหรับการสะสมข้อมูลและการเข้าถึง , วิธีการขอรับข้อมูลเพิ่มเติมและแผนในระยะสั้นสำหรับการพัฒนาทรัพยากรในอนาคต



รับต่อไปก่อน ส่วนวันที่ 202542 ; แก้ไขและยอมรับ 17 ตุลาคม 2542 .

ก่อนหน้านี้ส่วน
ต่อไป


แนะนำธนาคารข้อมูลโปรตีน ( PDB ) ก่อตั้งขึ้นที่ห้องปฏิบัติการแห่งชาติบรูกเฮเวน ( bnl ) ( 1 ) ในปี 1971 เป็นการถาวร สำหรับโครงสร้างของผลึกแมคโครโมเลกุลทางชีวภาพ ในการเริ่มต้นเก็บจัด 7 โครงสร้างและแต่ละปีที่หยิบขึ้นฝากในช่วงปี 1980 จำนวนฝากโครงสร้างเริ่มเพิ่มขึ้นอย่างรวดเร็ว เนื่องจากเทคโนโลยีดีขึ้นทุกด้านของกระบวนการทางโดยโครงสร้างที่กำหนดโดยแม่เหล็กนิวเคลียร์ ( NMR ) วิธีการและการเปลี่ยนแปลงในชุมชนความคิดเห็นเกี่ยวกับข้อมูลที่แบ่งปันโดยในช่วงต้นทศวรรษ 1990 ส่วนใหญ่ของวารสารต้องเลื่อการรหัสและอย่างน้อยหนึ่งแหล่งทุนจากสถาบันแห่งชาติของวิทยาศาสตร์การแพทย์ทั่วไป ) ประกาศใช้แนวทางเผยแพร่โดยสหภาพนานาชาติของผลึกศาสตร์ ( iucr ) ที่ต้องการสะสมข้อมูลโครงสร้างทั้งหมด

โหมดของการเข้าถึงข้อมูล PDB ที่มีการเปลี่ยนแปลงมากกว่าปีที่ผ่านมาเป็นผล ของการปรับปรุงเทคโนโลยีโดยเฉพาะความพร้อมของ WWW แทนจำหน่ายแต่เพียงผู้เดียวผ่านสื่อแม่เหล็ก เพิ่มเติม ต้องวิเคราะห์ข้อมูลที่หลากหลายชุด ต้องการพัฒนาระบบการจัดการข้อมูลที่ทันสมัย

เริ่มต้นการใช้งานของเส้นใยได้ จำกัด กลุ่มเล็ก ๆของผู้เชี่ยวชาญที่เกี่ยวข้องในโครงการวิจัยวันนี้ฝากไป PDB ที่มีแตกต่างกันความเชี่ยวชาญในเทคนิคเอกซเรย์คริสตัล การหาโครงสร้าง NMR , กล้องจุลทรรศน์ , cryoelectron และแบบจำลองทางทฤษฎี ผู้ใช้กลุ่มที่หลากหลายมากของนักวิจัยด้านชีววิทยา เคมี คอมพิวเตอร์ และ นักวิทยาศาสตร์ นักการศึกษา และนักเรียนทุกระดับ การไหลเข้าของข้อมูลมหาศาล ๆเป็นเชื้อเพลิงโดยในโครงสร้างโครงการและเพิ่มการรับรู้ของค่าของข้อมูลที่มีต่อความเข้าใจฟังก์ชันทางชีวภาพ , ความต้องการวิธีการใหม่เพื่อรวบรวมจัดระเบียบและเผยแพร่ข้อมูล .

ในตุลาคม 1998 , การจัดการของ PDB กลายเป็นความรับผิดชอบของ collaboratory งานวิจัยชีวสารสนเทศศาสตร์โครงสร้าง ( rcsb ) ในแง่ทั่วไปวิสัยทัศน์ของ rcsb คือการสร้างทรัพยากรบนพื้นฐานของเทคโนโลยีที่ทันสมัยที่สุดในการใช้และการวิเคราะห์ข้อมูลโครงสร้าง และดังนั้นจึง สร้างให้ทรัพยากรสำหรับการวิจัยทางชีวภาพ โดยเฉพาะในบทความนี้เราจะอธิบายขั้นตอนปัจจุบันสำหรับการสะสมข้อมูล การประมวลผลข้อมูล และการกระจายของข้อมูลข้อมูล PDB โดย rcsb . นอกจากนี้เราแก้ไขปัญหาของความสอดคล้องของข้อมูล เราได้มีการพัฒนาในปัจจุบันของ PDB .



ต่อไปก่อน ส่วนการซื้อข้อมูลและการประมวลผล

เป็นหัวใจสำคัญของการสร้างรัฐจัดเก็บข้อมูลที่มีประสิทธิภาพในการจับภาพและ curation ของข้อมูลการประมวลผลข้อมูล การประมวลผลข้อมูลประกอบด้วยการสะสมข้อมูล และการจัดการการตรวจสอบ
การแปล กรุณารอสักครู่..
 
ภาษาอื่น ๆ
การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.

Copyright ©2026 I Love Translation. All reserved.

E-mail: