请输入您要查询的百科知识:

 

词条 蛋白质三维结构数据库
释义

简介

蛋白质结构数据库(Protein Data Bank,简称PDB)是美国纽约Brookhaven国家实验室于1971年创建的。为适应结构基因组和生物信息学研究的需要,1998年10月由美国国家科学基金委员会、能源部和卫生研究院资助,成立了结构生物学合作研究协会(Research Collaboratory for Structural Bioinformat-ics,简称RCSB)。

PDB数据库改由RCSB管理,目前主要成员为拉特格斯大学(Rutgers University)、圣地亚哥超级计算中心(San Diego Supercomputer Cen-ter,简称SDSC)和国家标准化研究所(National Insti-tutes of Standards andTechnology,简称NIST)。和核酸序列数据库一样,可以通过网络直接向PDB数据库提交数据。

功能

PDB是目前最主要的收集生物大分子(蛋白质、核酸和糖)三维结构的数据库,是通过X射线单晶衍射、核磁共振、电子衍射等实验手段确定的蛋白质、多糖、核酸、病毒等生物大分子的三维结构数据库。随着晶体衍射技术的不断改进,结构测定的速度和精度也逐步提高。90年代以来,随着多维核磁共振溶液构象测定方法的成熟,使那些难以结晶的蛋白质分子的结构测定成为可能。蛋白质分子结构数据库的数据量迅速上升。据2000年5月统计,PDB数据库中已经存放了1万2千多套原子坐标,其中大部分为蛋白质,包括多肽和病毒。此外,还有核酸、蛋白和核酸复合物以及少量多糖分子。近年来,核酸三维结构测定进展迅速。PDB数据库中已经收集了800多套核酸结构数据。

PDB数据库允许用户用各种方式以及布尔逻辑组合(AND、OR和NOT)进行检索,可检索的字段包括功能类别、PDB代码、名称、作者、空间群、分辨率、来源、入库时间、分子式、参考文献、生物来源等项。用户不仅可以得到生物大分子的各种注释、坐标、三维图形、VAML等,并能从一系列指针连接到与PDB有关的数据库,包括SCOP、CATH、Medline、ENZYME、SWISS-3DIMAGE等。可通过FTP下载PDB数据。所有的PDB文件均有压缩和非压缩版以适应用户传输需要。PDB的电子公告版BBS和电子邮件兴趣小组(Mailing List)为用户提供了交流经验和发布新闻的空间。在PDB的服务器上还提供与结构生物学相关的多种免费软件如Rasmol、Mage、PDBBrowser、3DB Brower等。

特点

PDB数据库以文本文件的方式存放数据,每个分子各用一个独立的文件。除了原子坐标外,还包括物种来源、化合物名称、结构递交以及有关文献等基本注释信息。此外,还给出分辨率、结构因子、温度系数、蛋白质主链数目、配体分子式、金属离子、二级结构信息、二硫键位置等和结构有关的数据。

为PDB数据库以文本文件格式存放,故可以用文字编辑软件查看。显然,用文字编辑软件查看注释信息不太方便。更无法直观地了解分子的空间结构。RCSB开发的基于Web的PDB数据库概要显示系统。只列出主要信息,用户如须进一步了解详细信息,或查询其他蛋白质结构信息资源,可点击该页面左侧窗口中的按钮。此外,英国伦敦大学开发的PDBsum数据库是基于网络的PDB注释信息综合数据库。用于对PDB数据库的检索。使用十分方便。它将RasMol、CN3D等分子图形软件综合在一起,同时具有分析和图形显示功能。

蛋白质结构数据格式

每个PDB文件可能分割成一系列行,由行终止符终止。在记录文件中每行由80列组成。每条PDB记录末尾标志应该是行终止符。PDB文件中每行都是自我识别的。每行的前六列存放记录名称,左对齐空格补足.必须和规定的记录名称一致。PDB文件也可看成是各种记录类型的总和。每个记录类型包括一行或多行又被更深一层分成各字段。以下是PDB文件存储数据格式的一个完整简洁的说明:

标题部分

1 HEADER(分子类,公布日期、ID号)

2 OBSLTE (注明此ID号已改为新号)

3 TITLE(说明实验方法类型)

4 CAVEAT(可能的错误提示)

5 COMPND(化合物分子组成)

6 SOURCE(化合物来源)

7 KEYWDS(关键词)

8 EXPDTA(测定结构所用的实验方法)

9 AUTHOR(结构测定者)

10 REVDAT(修订日期及相关内容)

11 SPRSDE(已撤销或更改的相关记录)

12 JRNL(发表坐标集的文献)

13 REMARK

REMARK 1(有关文献)

REMARK 2(最大分辨率)

REMARK 3(用到的程序和统计方法)

REMARK 4-999

一级结构

1 DBREF (其他序列库的有关记录)

2 SEQADV ( PDB与其他记录的出入)

3 SEQRES (残基序列)

4 MODRES (对标准残基的修饰)

杂因子

1 HET(非标准残基)

2 HETNAM(非标准残基的名称)

3 HETSNY (非标准残基的同义字)

4 FORMOL(非标准残基的化学式)

二级结构

1 HELIX(螺旋)

2 SHEET(折叠片)

3 TURN(转角)

连接注释

1 SSBOND(二硫键)

2 LINK(残基间化学键)

3 HYDBND(氢键)

4 SLTBRG(盐桥)

5 CISPEP(顺式残基)

晶胞特征及坐标变换

1 CRYST1(晶胞参数)

2 ORIGXn(直角-PDB坐标)

3 SCALEn(直角-部分结晶学坐标)

4 MTRIXn(非晶相对称)

5 TVECT(转换因子)

坐标部分

1 MODEL(多亚基时示亚基号)

2 ATOM(标准基团的原子坐标)

3 SIGATM(标准差)

4 ANISOU(温度因子)

5 SIGUIJ(各种温度因素导致的标准差)

6 TER(链末端)

7 HETATM(非标准基团原子坐标)

8 ENDMDL(亚基结束)

连通性部分

CONECT(原子间的连通性有关记录)

簿记

1 MASTER (版权拥有者)

2 END(文件结束)

随便看

 

百科全书收录4421916条中文百科知识,基本涵盖了大多数领域的百科知识,是一部内容开放、自由的电子版百科全书。

 

Copyright © 2004-2023 Cnenc.net All Rights Reserved
更新时间:2025/1/28 10:31:21