请输入您要查询的百科知识:

 

词条 布鲁克海文蛋白质数据库
释义

PDB概述

布鲁克海文蛋白质数据库(The BrookHaven Protein Data Bank,PDB)是经实验测定的生物大分子三维结构数据档案,服务于全球科研、教育工作者和学生。其内容包括原子坐标、参考文献、一级和二级结构信息,也包括了晶体结构因数以及NMR实验数据。PDB时事通讯和CDROM每三个月发布一次。

----PDB由美联邦政府代理基金会与用户提供的经费联合资助,由美国国家科学基金、美国公众健康服务部、国家健康协会、国家研究资源中心、国家综合医学院、国家医学图书馆以及美国能源部在DE-AC02-76CH00016合约之下与用户提供的费用共同支持。

文件结构

----在蛋白质晶体结构数据库PDB中,各大分子结构是以分立的文件形式记录的,这些文件被称作PDB的入口文件(entry)。一个文件只反映某一个大分子结构的信息。每个大分子结构通过唯一的ID码(四位代码)来识别。早期入口文件的文件名后缀为".pdb",一种大分子对应一个文件。如阿比西尼亚卷心菜(CrambeAbyssinia)种子蛋白的ID码是1CRN,其入口文件名为1crn.pdb。1997年以后,每一种生物大分子有一组(3个)相关文件与之对应,它们是全文文件、书目文件和图形文件。例如,抗菌素MinorCoatProtein的ID码是1g3p,它的3个相关文件分别为1g3p.full(全文文件)、1g3p.biblio(书目文件)和1g3p.gif(图形文件);免疫球蛋白(Immunoglobulin)的ID码为1ap2,它的3个相关文件分别为1ap2.full、1ap2.biblio和1ap2.gif。在这三个文件中,.full文件相当于原来的.pdb文件。

----每一个PDB入口文件包含有标题部分、注释部分、一级结构、异质、二级结构、连通性注释、各种特性、结晶学、坐标变换、原子坐标、化学连接和簿记等12个部分。文件中每一行被称作一条记录,也被称作入口(entry),可理解为记录入口。每行包括80列,每个记录入口的最后一个字符是一个end-of-line(行结束符)。

----PDB文件也可以被看作记录类型(recordtype)的集合,它和一般的关系数据库概念不同。在关系数据库的库文件中,每条记录由不同数据类型和数据格式的若干字段组成,所有记录的字段结构都是相同的。而在PDB文件中,包含众多的记录类型,每类记录都有不同的格式。

----基于记录类型在一个PDB入口文件中出现的次数可将一组记录划分成以下六类:

Single(单次记录型):如HEADER、END和CRYST1,在一个文件中仅出现一次,没有接续部分;

SingleContinued(单次接续型):如AUTHOR、CAVEAT和COMPND,在一个文件中概念性地存在一次。其内容如果超过一行,可表示在后续行中,这些后续行包括一个接续指示字段;

Multiple(多次记录型):在一个文件中出现多次,如ATOM、CONECT和HELIX.在这类记录类型中信息以列表的形式出现;

MultipleContinued(多次接续型):如FORMUL、HETATM和HETNAM,在一个入口文件中概念性地存在多次,每条记录内容超过一行的部分可表示在后续行中,这些后续行包括一个接续指示字段;

Grouping:用来作为其他记录类别的分组标志记录型,如ENDMDL、MODEL和TER;

Other:其他记录类型,如JRNL(定义坐标系列的文献引用)和REMARK(一般注释)。

----每个记录类型以固定的列数分割成若干字段,字段应包含数据类型、字段名和字段定义。

PDB应用

----生物大分子的三维结构是了解生物分子功能的前提。对于分子生物学家、细胞生物学家和生物化学家而言,建立生物过程的分子机制越来越重要。由于X射线衍射技术的发展,特别是近年来NMR技术的发展,生物大分子的三维结构信息增长极快,布鲁克海文蛋白质数据库的建立极大地方便了生物化学家和分子生物学家的研究工作,为医学领域中的科研和教学提供了大分子的宝贵资料,具有重要的应用价值。尤其是近年来随着Internet信息开发和应用,人们可以进行资源共享,还可以通过三维图像显示软件,如RASMOL、VRML显示蛋白质的结构图像,这些都为PDB资源的利用提供了广阔的天地。

随便看

 

百科全书收录4421916条中文百科知识,基本涵盖了大多数领域的百科知识,是一部内容开放、自由的电子版百科全书。

 

Copyright © 2004-2023 Cnenc.net All Rights Reserved
更新时间:2024/12/23 13:12:01