The term genome is defined as the total genetic information that can be obtained about an entity. The human genome, for example generally refers to the complete set of genes required to create a human being-estimated to be between 100,000 and 300,000 genes spread over 23 pairs of chromosomes, with an estimated 3-4 billion nucleotides.
The goal of the Human Genome Project (HGP)
sequence-the ordering of the base-of those nucleotides. At present only 8,000 genes have been identified and and less than 10 percent of the human genome has been sequenced. However, the entire sequence is expected to the completed by the year 2002. In isolation, the human DNA sequence is not particularly useful. The sequence can however be combined with other data and useful and used as a powerful tool to help address questions in genetics, biochemistry medicine,anthropology, and agriculture. In the existing genome databases, the focus has been on??curating? (or collecting with some initial scrunity and quality check) and classifying information about genome, numerous organism such as E.coli, Dropsophila, and C.elegan have been investigated.
Benbank:- The preminent DNA requence database in the world today is Genback, maintained by the National Center for Biotechnology Information (NCBI) of the National Library of Medicine(NLM). It was established in 1978 as a central repository for DNA sequence data. Since then it has expanded somewhat in scope to include expressed sequence tag data, protein sequence data, three-dimensional protein structure, taxonomy and links to the literature (MEDLINE). Its latest release contains over 602,000,000 nucleotide base of more than 920,000 sequences form over 16,000 species with roughly ten new organism being added each day. The database size has double approximately every eighteen months for five years.
While it is a complex, comprehensive database, the scope of its coverage is focused on human sequences and links to the literature. Other limited data sources (e.g. three-dimensional structure and OMM, disscused PDB databases and redesigned the structure of the Genbank system to accommodate these new data sets. The system is maintained as a combination of flat files, relational databases, and files containing Abstract Syntax Notation One (ASN.1)-a syntax for defining data structure developed for the telecommunications industry. Each Genback entry is assigned a unique identifier by the UCBI. Updates are assigned a new identifier, with the identifier of the original entity remaining unchanged for archival purposes. Older refrence to an entity thus do not inadvertently indicate a new and possible inapproapriate values. The most current concepts also receive a second set of unique identifiers (UIDs), which marks the most up-to-date form of a concepts while allowing older version to be accessed via there original identifier.
The average user of the database is not able to access the structure of the data directly for querying or other functions, although complete snapshots of the database are available for export in a number of formats, including ASN.1 the query mechanism provide a via the enter application (or its world wide web version), which allows keywords, sequences, and
through a static interface.
The Genome Database (GDB) :-Created in 1989, the genome database (GDB) is a catalog human genome mapping data, a process that assocciates a piece of information with a particular location location on the human genome. The degree of precision of this location on the mapdepends upon the source of the data, but it is usually not at the level of Individual necleotide bases GDB data includes data describing primarly map
Polymerase China Reaction
primer, and reagents used). More recently efforts have been made to add data on
linked to genetic lock, cell lines used in experiments, DNA probe
mutation
libraries, and some limited polymorphism and population data.
The GDB systems is built around SYBASE, a commercial relational DBMS, and its data are modeled
implementers of GDB have noted difficulties in using this model to capture more than simple map and probe data. In order to improve data integrity and to simplify the programming for the application writer, GDB distributes a Database Access Toolkits. However, most users use a web interfaces to search the ten interlinked data managers. Each manager keeps tracks of the link (relationships) for one of the ten tables within the GDB system. As with Genbank, users are given only a very high-level view of the data at the time of searching and thus cannot easily make use of any knowlegde gleaned from the structure of the GDB tables. Search methods are most useful when users are simply looking for an index into map or probe data.Expoloratory ad hoc searching of the database is not encouraged by present interfaces. Integration of the database structures of GDB and OMM was never fully established.
จีโนมเป็นคำที่กำหนดให้เป็นข้อมูลทางพันธุกรรมทั้งหมดที่จะได้รับเกี่ยวกับนิติบุคคล จีโนมมนุษย์ตัวอย่างเช่นโดยทั่วไปหมายถึงชุดของยีนที่จำเป็นในการสร้างของมนุษย์เป็นที่คาดกันว่าจะอยู่ระหว่าง 100,000 และ 300,000 ยีนกระจายกว่า 23 คู่ของโครโมโซมที่มีประมาณ 3-4000000000 นิวคลีโอเป้าหมายของมนุษย์ โครงการจีโนม (HGP) ลำดับการสั่งซื้อของฐานของนิวคลีโอที่ ในปัจจุบันเพียง 8,000 ยีนที่ได้รับการระบุและและน้อยกว่าร้อยละ 10 ของจีโนมของมนุษย์ได้รับการติดใจ แต่ลำดับทั้งหมดที่คาดว่าจะแล้วเสร็จภายในปี 2002. ในการแยกลำดับดีเอ็นเอของมนุษย์ไม่ได้เป็นประโยชน์อย่างยิ่ง ลำดับ แต่สามารถนำมารวมกับข้อมูลอื่น ๆ และที่เป็นประโยชน์และนำมาใช้เป็นเครื่องมือที่มีประสิทธิภาพที่จะช่วยให้คำถามที่อยู่ในพันธุศาสตร์การแพทย์ชีวเคมีมานุษยวิทยาและการเกษตร ในฐานข้อมูลจีโนมที่มีอยู่โดยมุ่งเน้นที่ได้รับใน? curating? (หรือการจัดเก็บภาษีกับบาง scrunity เริ่มต้นและการตรวจสอบคุณภาพ) และการจำแนกข้อมูลเกี่ยวกับจีโนมสิ่งมีชีวิตมากมายเช่น E.coli, Dropsophila และ C.elegan ได้รับการตรวจสอบBenbank: - ฐานข้อมูลดีเอ็นเอ requence preminent ในโลกในวันนี้คือ Genback, ดูแลโดยศูนย์สารสนเทศเทคโนโลยีชีวภาพ (NCBI) ของหอสมุดแห่งชาติยา (NLM) ก่อตั้งขึ้นในปี 1978 เป็นพื้นที่เก็บข้อมูลกลางสำหรับข้อมูลลำดับดีเอ็นเอ ตั้งแต่นั้นมาก็มีการขยายตัวค่อนข้างอยู่ในขอบเขตที่จะรวมถึงแสดงข้อมูลแท็กลำดับข้อมูลลำดับโปรตีนโปรตีนโครงสร้างสามมิติอนุกรมวิธานและเชื่อมโยงกับวรรณกรรม (MEDLINE) รุ่นล่าสุดของมันมีมากกว่า 602,000,000 ฐานเบื่อหน่ายกว่า 920,000 ลำดับรูปแบบกว่า 16,000 ชนิดที่มีประมาณสิบสิ่งมีชีวิตใหม่ที่เพิ่มเข้ามาในแต่ละวัน ขนาดฐานข้อมูลมีสองประมาณทุกสิบแปดเดือนเป็นเวลาห้าปีในขณะที่มันเป็นที่ซับซ้อนฐานข้อมูลที่ครอบคลุมขอบเขตของความคุ้มครองที่จะเน้นในลำดับของมนุษย์และการเชื่อมโยงไปยังวรรณกรรม แหล่งที่มาของข้อมูลที่ จำกัด อื่น ๆ (เช่นโครงสร้างสามมิติและ OMM, disscused ฐานข้อมูล PDB และการออกแบบโครงสร้างของระบบ Genbank เพื่อรองรับเหล่านี้ชุดข้อมูลใหม่. ระบบจะยังคงเป็นชุดของไฟล์แบนฐานข้อมูลเชิงสัมพันธ์และไฟล์ที่มีบทคัดย่อไวยากรณ์ สัญกรณ์หนึ่ง (ASN.1) ไวยากรณ์สำหรับการกำหนดโครงสร้างข้อมูลสำหรับการพัฒนาอุตสาหกรรมโทรคมนาคม. แต่ละรายการ Genback มีการกำหนดตัวระบุที่ไม่ซ้ำกันโดย UCBI. การปรับปรุงจะกำหนดตัวบ่งชี้ใหม่ที่มีการระบุของนิติบุคคลที่เหลืออยู่เดิมไม่เปลี่ยนแปลงสำหรับการเก็บถาวร วัตถุประสงค์. refrence เก่านิติบุคคลจึงไม่โดยไม่ตั้งใจแสดงค่า inapproapriate ใหม่และเป็นไปได้. แนวความคิดในปัจจุบันส่วนใหญ่ยังได้รับชุดที่สองของตัวระบุที่ไม่ซ้ำกัน (UIDs) ซึ่งนับเป็นรูปแบบ up-to-วันที่มากที่สุดของแนวคิดขณะที่ช่วยให้ รุ่นเก่าที่จะเข้าถึงได้ผ่านทางเดิมที่มีการระบุผู้ใช้โดยเฉลี่ยของฐานข้อมูลจะไม่สามารถเข้าถึงโครงสร้างของข้อมูลโดยตรงสำหรับการสอบถามหรือฟังก์ชันอื่น ๆ ถึงแม้ว่าภาพรวมที่สมบูรณ์ของฐานข้อมูลที่มีอยู่สำหรับการส่งออกในหลายรูปแบบรวมทั้ง ASN.1 กลไกแบบสอบถามให้ผ่านเข้าสู่โปรแกรม (หรือรุ่นเว็บทั่วโลก) ซึ่งจะช่วยให้คำหลักลำดับและผ่านอินเตอร์เฟซแบบคงที่จีโนมฐานข้อมูล (GDB): สร้างขึ้นในปี 1989 ฐานข้อมูลจีโนม (GDB ) เป็นข้อมูลแผนที่จีโนมมนุษย์แคตตาล็อกกระบวนการที่ assocciates ชิ้นส่วนของข้อมูลที่มีสถานที่ตั้งโดยเฉพาะอย่างยิ่งเกี่ยวกับจีโนมมนุษย์ ระดับของความแม่นยำของตำแหน่งบน mapdepends กับแหล่งที่มาของข้อมูลนี้ แต่ก็มักจะไม่อยู่ในระดับของฐานข้อมูลบุคคล necleotide GDB รวมถึงข้อมูลเบื้องต้นอธิบายแผนที่ปฏิกิริยาโพลิเมอร์จีนไพรเมอร์และสารเคมีที่ใช้) เมื่อเร็ว ๆ นี้มีความพยายามที่จะเพิ่มข้อมูลเกี่ยวกับการเชื่อมโยงไปยังล็อคพันธุกรรมเซลล์ที่ใช้ในการทดลองตรวจสอบดีเอ็นเอกลายพันธุ์ห้องสมุดและบาง polymorphism จำกัด และข้อมูลประชากรระบบ GDB จะสร้างรอบ SYBASE, DBMS เชิงสัมพันธ์ทางการค้าและข้อมูล จะสร้างแบบจำลองของ implementers GDB จะสังเกตเห็นความยากลำบากในการใช้รูปแบบนี้ในการจับมากกว่าแผนที่ที่ง่ายและสืบสวนสอบสวนข้อมูล เพื่อที่จะปรับปรุงความสมบูรณ์ของข้อมูลและลดความซับซ้อนของการเขียนโปรแกรมสำหรับนักเขียนโปรแกรมที่ GDB จำหน่ายฐานข้อมูล Toolkits เข้า แต่ผู้ใช้ส่วนใหญ่ใช้การเชื่อมต่อเว็บเพื่อค้นหาเชื่อมโยงกันสิบผู้จัดการข้อมูล ช่วยให้ผู้จัดการแต่ละแทร็คของการเชื่อมโยง (ความสัมพันธ์) หนึ่งในสิบตารางในระบบ GDB เช่นเดียวกับ Genbank ผู้ใช้จะได้รับเฉพาะมุมมองระดับที่สูงมากของข้อมูลในขณะที่การค้นหาและทำให้ไม่สามารถใช้ประโยชน์จาก knowlegde ใด ๆ ที่รวบรวมได้จากโครงสร้างของตาราง GDB วิธีการค้นหาที่เป็นประโยชน์มากที่สุดเมื่อผู้ใช้เป็นเพียงการมองสำหรับดัชนีลงในแผนที่หรือสอบสวน data.Expoloratory เฉพาะกิจการค้นหาของฐานข้อมูลที่ไม่ได้รับการสนับสนุนจากการเชื่อมต่อในปัจจุบัน บูรณาการของโครงสร้างฐานข้อมูลของ GDB และ OMM ไม่เคยถูกจัดตั้งขึ้นอย่างเต็มที่
การแปล กรุณารอสักครู่..

คำว่าโครโมโซม หมายถึง ข้อมูลทางพันธุกรรมทั้งหมดที่สามารถได้รับเกี่ยวกับนิติบุคคล จีโนมมนุษย์ ตัวอย่างโดยทั่วไปหมายถึงชุดสมบูรณ์ของยีนที่ต้องสร้างมนุษย์ประมาณระหว่าง 100000 300000 ยีนและการแพร่กระจายมากกว่า 23 คู่ของโครโมโซมมีประมาณ 3-4 พันล้าน nucleotides
เป้าหมายของโครงการจีโนมมนุษย์ ( hgp )
ลำดับการสั่งซื้อของเบสของนิวคลีโอไทด์นั้น ปัจจุบัน เพียง 8 , 000 ยีนได้รับการระบุและน้อยกว่าร้อยละ 10 ของจีโนมมนุษย์ได้นี้ อย่างไรก็ตาม ลำดับทั้งหมด คาดว่าจะเสร็จภายในปี 2002 ในการแยกดีเอ็นเอลำดับไม่ได้เป็นประโยชน์เฉพาะลําดับที่สามารถ แต่จะรวมกับข้อมูลอื่น ๆและเป็นประโยชน์ และใช้เป็นเครื่องมือที่มีประสิทธิภาพเพื่อช่วยถามที่อยู่ในพันธุศาสตร์ชีวเคมีการแพทย์มานุษยวิทยา และการเกษตร ในจีโนมฐานข้อมูลที่มีอยู่ , โฟกัสได้ ? ? You ? ( หรือเก็บบางส่วนเริ่มต้น scrunity และตรวจสอบคุณภาพ ) และจำแนกข้อมูลเกี่ยวกับจีโนมมากมาย สิ่งมีชีวิต เช่น E.coli ,dropsophila และ c.elegan ได้ทำการศึกษา
benbank : - preminent ดีเอ็นเอ requence ฐานข้อมูลในโลกวันนี้เป็น genback , รักษาโดยศูนย์สารสนเทศเทคโนโลยีชีวภาพแห่งชาติ ( ncbi ) ของห้องสมุดแห่งชาติของแพทย์ ( nlm ) ก่อตั้งขึ้นในปี 1978 เป็น พื้นที่เก็บข้อมูลกลางสำหรับลำดับข้อมูลดีเอ็นเอตั้งแต่นั้นมาก็มีการขยายตัวค่อนข้างในขอบเขตรวมถึงแสดงลำดับข้อมูลแท็กโปรตีน ลำดับข้อมูล โครงสร้างสามมิติของโปรตีน , และเชื่อมโยงกับวรรณกรรม ( Medline ) รุ่นล่าสุดของมันมีมากกว่า 602000000 นิวคลีโอไทด์เบสมากกว่า 920 , 000 ลำดับรูปแบบกว่า 16 , 000 ชนิด ที่มีประมาณสิบชีวิตที่ถูกเพิ่มในแต่ละวันฐานข้อมูลมีขนาดประมาณทุก ๆสองเดือนแปดห้าปี
ในขณะที่มันซับซ้อน ฐานข้อมูลที่ครอบคลุมขอบเขตของความคุ้มครองจะเน้นลำดับของมนุษย์และเชื่อมโยงกับวรรณกรรม จำกัด แหล่งข้อมูลอื่น ๆ ( เช่นโครงสร้างสามมิติและ omm disscused , ฐานข้อมูล PDB และออกแบบโครงสร้างของระบบรองรับใหม่เหล่านี้พบข้อมูลชุดระบบจะยังคงเป็นชุดของแฟ้มแบนฐานข้อมูลเชิงสัมพันธ์ และไฟล์ที่มีไวยากรณ์นามธรรมโน้ตหนึ่ง ( ขึ้น 1 ) - ไวยากรณ์สำหรับการกำหนดข้อมูลที่สร้างขึ้นสำหรับอุตสาหกรรมโทรคมนาคม แต่ละรายการ genback กำหนดตัวระบุโดย ucbi . การปรับปรุงจะได้รับผลใหม่กับผลของกิจการเดิมยังคงไม่เปลี่ยนแปลงสำหรับวัตถุประสงค์จดหมายเหตุ REFRENCE เก่า นิติบุคคลจึงไม่ตั้งใจแสดงใหม่และค่า inapproapriate ที่สุด แนวคิดปัจจุบันส่วนใหญ่ยังได้รับชุดที่สองของตัวระบุเอกลักษณ์ ( หมายเลขผู้ใช้ของ ) ซึ่งนับเป็นรูปแบบทันสมัยที่สุดของแนวคิดในขณะที่ให้รุ่นเก่าจะเข้าถึงได้ผ่านทางต้นฉบับมีการระบุ .
ผู้ใช้โดยเฉลี่ยของฐานข้อมูลจะไม่สามารถเข้าถึงโครงสร้างของข้อมูลได้โดยตรงเพื่อสอบถามหรือฟังก์ชันอื่น ๆแม้ว่าภาพรวมที่สมบูรณ์ของฐานข้อมูลที่มีอยู่เพื่อส่งออกในหลายรูปแบบรวมทั้ง asn 1 แบบสอบถามกลไกให้ผ่านเข้าโปรแกรม ( หรือเวิลด์ไวด์เว็บรุ่น ) ซึ่ง ช่วยให้คำหลัก , ลําดับและ
ผ่านอินเตอร์เฟซแบบคงที่ .
ฐานข้อมูลจีโนม ( Name ) : สร้างขึ้นในปี 1989 , ฐานข้อมูลจีโนม ( Name ) เป็นแคตตาล็อกข้อมูลแผนที่จีโนมมนุษย์ , กระบวนการที่ assocciates ชิ้นส่วนของข้อมูลกับสถานที่เฉพาะสถานที่ในจีโนมมนุษย์ ระดับความแม่นยำของตำแหน่งนี้ใน mapdepends ตามแหล่งที่มาของข้อมูลแต่มันมักจะไม่ได้อยู่ในระดับของแต่ละฐาน necleotide GDB ข้อมูลรวมถึงข้อมูลอธิบาย primarly แผนที่
โดยจีนปฏิกิริยา
รองพื้น และสารเคมีที่ใช้ ) เมื่อเร็ว ๆ นี้ความพยายามได้รับการทำเพื่อเพิ่มข้อมูล
ลิงค์ล็อคพันธุกรรมเซลล์ที่ใช้ในการทดลอง คือ การกลายพันธุ์ดีเอ็นเอตรวจสอบ
ห้องสมุดและมีจำกัด ) และข้อมูลประชากร .
GDB ระบบถูกสร้างขึ้นรอบๆ Sybase , DBMS เชิงสัมพันธ์ทางการค้า และข้อมูลเป็นแบบ
แต่ GDB เป็นความยากลำบากในการใช้แบบจำลองเพื่อจับกว่าง่ายแผนที่และตรวจสอบข้อมูล เพื่อปรับปรุงความสมบูรณ์ของข้อมูล และลดความซับซ้อนของการเขียนโปรแกรมการเข้าถึงฐานข้อมูล gdb กระจายชุดเครื่องมือ . อย่างไรก็ตามผู้ใช้ส่วนใหญ่ใช้เว็บอินเทอร์เฟซการค้นหาสิบเชื่อมโยงผู้จัดการข้อมูล แต่ละฝ่ายจะติดตามการเชื่อมโยง ( ความสัมพันธ์ ) หนึ่งของโต๊ะสิบตัวภายในระบบ gdb . ด้วยขนาด ผู้ใช้จะได้รับเพียงระดับสูงมากมุมมองของข้อมูลที่เวลาของการค้นหาและจึงไม่สามารถใช้ประโยชน์ของความรู้ที่รวบรวมได้จากโครงสร้างของ GDB ตารางวิธีการค้นหามีประโยชน์มากที่สุดเมื่อผู้ใช้เป็นเพียงการมองหาดัชนีลงในแผนที่หรือข้อมูลการสอบสวน expoloratory เฉพาะกิจค้นหาของฐานข้อมูลที่ไม่สนับสนุนโดยนำเสนอการเชื่อมต่อ . การบูรณาการฐานข้อมูลและโครงสร้างของ GDB omm เคยก่อตั้งขึ้นอย่างเต็มที่
การแปล กรุณารอสักครู่..
