词条 | 蛋白质三维结构数据库 |
释义 | 简介蛋白质结构数据库(Protein Data Bank,简称PDB)是美国纽约Brookhaven国家实验室于1971年创建的。为适应结构基因组和生物信息学研究的需要,1998年10月由美国国家科学基金委员会、能源部和卫生研究院资助,成立了结构生物学合作研究协会(Research Collaboratory for Structural Bioinformat-ics,简称RCSB)。 PDB数据库改由RCSB管理,目前主要成员为拉特格斯大学(Rutgers University)、圣地亚哥超级计算中心(San Diego Supercomputer Cen-ter,简称SDSC)和国家标准化研究所(National Insti-tutes of Standards andTechnology,简称NIST)。和核酸序列数据库一样,可以通过网络直接向PDB数据库提交数据。 功能PDB是目前最主要的收集生物大分子(蛋白质、核酸和糖)三维结构的数据库,是通过X射线单晶衍射、核磁共振、电子衍射等实验手段确定的蛋白质、多糖、核酸、病毒等生物大分子的三维结构数据库。随着晶体衍射技术的不断改进,结构测定的速度和精度也逐步提高。90年代以来,随着多维核磁共振溶液构象测定方法的成熟,使那些难以结晶的蛋白质分子的结构测定成为可能。蛋白质分子结构数据库的数据量迅速上升。据2000年5月统计,PDB数据库中已经存放了1万2千多套原子坐标,其中大部分为蛋白质,包括多肽和病毒。此外,还有核酸、蛋白和核酸复合物以及少量多糖分子。近年来,核酸三维结构测定进展迅速。PDB数据库中已经收集了800多套核酸结构数据。 PDB数据库允许用户用各种方式以及布尔逻辑组合(AND、OR和NOT)进行检索,可检索的字段包括功能类别、PDB代码、名称、作者、空间群、分辨率、来源、入库时间、分子式、参考文献、生物来源等项。用户不仅可以得到生物大分子的各种注释、坐标、三维图形、VAML等,并能从一系列指针连接到与PDB有关的数据库,包括SCOP、CATH、Medline、ENZYME、SWISS-3DIMAGE等。可通过FTP下载PDB数据。所有的PDB文件均有压缩和非压缩版以适应用户传输需要。PDB的电子公告版BBS和电子邮件兴趣小组(Mailing List)为用户提供了交流经验和发布新闻的空间。在PDB的服务器上还提供与结构生物学相关的多种免费软件如Rasmol、Mage、PDBBrowser、3DB Brower等。 特点PDB数据库以文本文件的方式存放数据,每个分子各用一个独立的文件。除了原子坐标外,还包括物种来源、化合物名称、结构递交以及有关文献等基本注释信息。此外,还给出分辨率、结构因子、温度系数、蛋白质主链数目、配体分子式、金属离子、二级结构信息、二硫键位置等和结构有关的数据。 为PDB数据库以文本文件格式存放,故可以用文字编辑软件查看。显然,用文字编辑软件查看注释信息不太方便。更无法直观地了解分子的空间结构。RCSB开发的基于Web的PDB数据库概要显示系统。只列出主要信息,用户如须进一步了解详细信息,或查询其他蛋白质结构信息资源,可点击该页面左侧窗口中的按钮。此外,英国伦敦大学开发的PDBsum数据库是基于网络的PDB注释信息综合数据库。用于对PDB数据库的检索。使用十分方便。它将RasMol、CN3D等分子图形软件综合在一起,同时具有分析和图形显示功能。 蛋白质结构数据格式每个PDB文件可能分割成一系列行,由行终止符终止。在记录文件中每行由80列组成。每条PDB记录末尾标志应该是行终止符。PDB文件中每行都是自我识别的。每行的前六列存放记录名称,左对齐空格补足.必须和规定的记录名称一致。PDB文件也可看成是各种记录类型的总和。每个记录类型包括一行或多行又被更深一层分成各字段。以下是PDB文件存储数据格式的一个完整简洁的说明: 标题部分 1 HEADER(分子类,公布日期、ID号) 2 OBSLTE (注明此ID号已改为新号) 3 TITLE(说明实验方法类型) 4 CAVEAT(可能的错误提示) 5 COMPND(化合物分子组成) 6 SOURCE(化合物来源) 7 KEYWDS(关键词) 8 EXPDTA(测定结构所用的实验方法) 9 AUTHOR(结构测定者) 10 REVDAT(修订日期及相关内容) 11 SPRSDE(已撤销或更改的相关记录) 12 JRNL(发表坐标集的文献) 13 REMARK REMARK 1(有关文献) REMARK 2(最大分辨率) REMARK 3(用到的程序和统计方法) REMARK 4-999 一级结构 1 DBREF (其他序列库的有关记录) 2 SEQADV ( PDB与其他记录的出入) 3 SEQRES (残基序列) 4 MODRES (对标准残基的修饰) 杂因子 1 HET(非标准残基) 2 HETNAM(非标准残基的名称) 3 HETSNY (非标准残基的同义字) 4 FORMOL(非标准残基的化学式) 二级结构 1 HELIX(螺旋) 2 SHEET(折叠片) 3 TURN(转角) 连接注释 1 SSBOND(二硫键) 2 LINK(残基间化学键) 3 HYDBND(氢键) 4 SLTBRG(盐桥) 5 CISPEP(顺式残基) 晶胞特征及坐标变换 1 CRYST1(晶胞参数) 2 ORIGXn(直角-PDB坐标) 3 SCALEn(直角-部分结晶学坐标) 4 MTRIXn(非晶相对称) 5 TVECT(转换因子) 坐标部分 1 MODEL(多亚基时示亚基号) 2 ATOM(标准基团的原子坐标) 3 SIGATM(标准差) 4 ANISOU(温度因子) 5 SIGUIJ(各种温度因素导致的标准差) 6 TER(链末端) 7 HETATM(非标准基团原子坐标) 8 ENDMDL(亚基结束) 连通性部分 CONECT(原子间的连通性有关记录) 簿记 1 MASTER (版权拥有者) 2 END(文件结束) |
随便看 |
|
百科全书收录4421916条中文百科知识,基本涵盖了大多数领域的百科知识,是一部内容开放、自由的电子版百科全书。