请输入您要查询的百科知识:

 

词条 中国科学院科学数据库
释义

中国科学院科学数据库的内容涵盖了化学、生物、天文、材料、腐蚀、光学机械、自然资源、能源、生态环境、湖泊、湿地、冰川、大气、古气候、动物、水生生物、遥感等多种学科,由中国科学院各学科领域几十个研究所的科研人员参加建设。科学数据库专业数据库已达到180个,总数据量达7250亿字节(725GB)。科学数据库基于中国科技网对国内外用户提供服务,在中国科技网上已建立了集中与分布的Web站点19个,上网专业数据库153个,数据量约3250亿字节(325GB)。

一、背景与历程

中国科学院科学数据库正是在上述过程中发展起来的。中国科学院作为中国自然科学的研究中心,在长期的科学研究实践中,通过观测、考察、试验、计算等多种途径产生和积累了大量具有重要科学价值和实用意义的科学数据和资料,但由于管理手段落后,无法充分发挥这些宝贵信息资源的作用。60年代发展起来的数据库技术,为有效管理和开发应用科学数据创造了有利条件。70年代开始各研究所在自己学科领域中试建数据库,特别是化学领域的专业库得到迅速发展。专业库的建立促进了数据科学管理的进程,然而分散的、独立的库,限制了数据规范标准的统一和共享的实现。为此,中国科学院1983年提出了“科学数据库及其信息系统”的建设项目,1986年被国家计委列为国家“七五”和“八五”期间的重点工程项目。同时,中国科学院将其列入“七五”院重大项目和“八五”、 “九五”院基础研究特别支持项目;“系统网络软件开发”又作为国家基金委1995年网络应用重大项目予以支持,使系统不断取得突破性进展。十多年来,随着计算机技术的进步和用户需求的不断变化,系统也不断改进和完善。科学数据库的研制和建设过程正是知识积累、加工、利用和传播的过程,是跟踪数据库技术、网络技术发展和应用的过程,是数据资料逐步规范标准和积累的过程,也是广大系统建设者与用户不断沟通,向实用化发展的过程。为此,科学数据库及其信息系统1997年获中国科学院科技进步一等奖,1998年获国家科技进步二等奖。

科学数据库经过十几年的建设和发展,已经成为目前国内信息量最大,学科专业最广,服务层次最高,综合性最强的科学信息服务系统。同时,也成为科研工作的基础设施之一,并将成为未来科学研究必不可缺少的资源。目前,“科学数据库及其应用系统”作为中国科学院信息化建设的重要基础设施,已经纳入了中国科学院“十五”期间信息化建设的重大项目,给科学数据库的建设和发展带来了一个有利的时机,科学数据库将在“十五”建设期间得到长足的发展,为社会做出更大的贡献。

二、内容与特点

1.数据资源

科学数据库由中心站点和分布在网上本地和外地的相互独立的若干个专业库子站点组成了网上的科技信息服务体系。

多年来,科学数据库的研制者利用这批宝贵的数据资源进行了大量的专业咨询服务、专业应用服务和网上综合科研信息服务,已在国家经济建设、国防建设、规划决策、科学研究、科技攻关、学科发展、国际合作等诸多方面得到应用,取得了显著的社会效益和一定的经济效益,在国内外产生了一定影响。

2.服务系统

多年来,科学数据库采用逻辑上集中、物理上分布的建库和运行服务体系,形成了一个从基本的数据库检索直至专业咨询、决策服务的完整的科技信息服务系统。

科学数据库专业数据库的研制者将多年科研工作积累起来的宝贵的数据资源收集整理,在不同学科的建库单位建成了专业数据库。同时,又将他们的专业知识和多年积累的科研工作经验相结合,开发出基于专业数据库的数学模型和专家系统,形成了不同专业的专业咨询系统、科研过程和生产过程模拟系统,乃至于综合科研信息服务系统等等实用系统,进行深层次的专业咨询服务和科学数据库的增值服务,直接服务于专业研究和国家经济建设。

1996年科学数据库率先在中国科技网上建立了中心主站点,开始实现了科学数据库集中与分布相结合,通过网络向国内外用户提供服务。几年来,科学数据库中心站点将集中在中心的数据库和分布在中国科技网上的19个子站点的专业数据库进行分布式的链接或导航,实现了科学数据库整体上网服务,初步建成了科学数据库网络信息服务系统。

随着网络的发展,科学数据库的应用也越来越广泛,专业数据库在扩大用户面上不同程度的做了很多工作,并逐渐得到社会的重视。网上检索服务随着上网内容的不断增加和充实,日益得到用户的瞩目。1998年化学专业数据库与上海热线连接,方便了上海用户的访问;中国菌种目录数据库已经分别在日本农业网和亚太地区高速网上建立了镜像。

3.技术开发

“九五”初期,科学数据库系统率先采用CGI技术实现了科学数据库上网服务。随着网络及数据库技术的发展,近年来,科学数据库中心对多层客户机/服务器技术进行研究,就www与数据库之间的多种连接技术进行了跟踪。实现了科学数据库系统的开发环境和运行环境的分离,用专业的系统同步软件来保证运行环境与开发环境的一致性、数据更新的及时性和有效性,采取了一系列最新的安全防范措施来提高整个系统的安全性和可靠性。同时,在多台服务器上安装了自行开发的统计分析软件,用于统计整个Web服务器的被访问情况。

2000年科学数据库有关建库单位合作完成了863信息技术领域的应用项目《高速计算环境下的科学数据库应用系统》和国家基金委重大应用项目《高速网络环境下的科学数据库应用系统》,在高速网和曙光2000-II超级服务器上基于科学数据库建立了生物,地学,天文三个应用实验系统,开发了科学数据库应用系统支撑平台。科学数据库应用支撑平台是一个集中高性能计算环境、高速网络环境和丰富的中间件软件环境的综合系统环境。内容是在中国科学院计算机网络信息中心的网格节点上,基于曙光2000-II超级计算机和科学数据库系统,建立一个集超级计算机、科学数据库和高速互联网为一体的技术支撑平台,开发基于科学数据库的不同专业、不同层次的应用系统。

4.硬件环境

科学数据库中心的硬件系统环境是建立了以曙光2000-II超级服务器和SGI Challenge L服务器为主体,以及若干DEC ,IBM ,SUN ,SGI工作站组成的网上开发和服务环境。曙光2000-II超级服务器包含82个节点,峰值计算能力110G Flops。海量存储环境有1.5 TB的磁盘阵列。

三、组织与管理

科学数据库建设是中国科学院全院范围内的跨所联合,力图在全院范围内将研究所多年积累起来的科技信息资源组织起来,与计算机、数据库和网络等先进技术相结合,对社会提供科技资源共享与服务。科学数据库的组织形式是以综合型重大工程项目的方式进行的。从十几年来科学数据库的建设和发展的实践经验来看,这种组织方式是行之有效的。

科学数据库在组织实施过程中,实现了跨学科的联合和数据、人才、技术的集中,体现了中国科学院的整体优势,在建立中国科学院和国家科研工作的基础体系中起到了龙头的牵引带动作用,提升了专业数据库的技术能力,综合能力和整体服务能力。

1.管理模式

多年来,科学数据库在科学数据库专家委员会的领导下,由科学数据库办公室进行课题管理,各建库单位负责对本单位的建库课题进行组织实施。

科学数据库的组织管理结构采用以下方式:

(1)科学数据库专家委员会

专家委员会是科学数据库的学术领导机构,在院的领导下,负责中国科学院科学数据库有关重大问题的决策和管理。负责制定科学数据库的发展规划和实施计划,确定经费的具体资助范围和原则,审定资助的项目及经费分配方案,检查监督项目的执行情况。课题成果的评审、鉴定、验收,由专家委员会组织进行。

(2)科学数据库办公室

科学数据库办公室是专家委员会的办事机构,设在中国科学院计算机网络信息中心。课题的内容、目标和经费经专家委员会审定立项后,由科学数据库办公室按照院重大工程项目的管理办法进行管理。课题合同的检查验收,由科学数据库办公室组织进行。

2.组织实施

(1)专家论证

科学数据库课题的立项,要经过科学数据库专家委员会的论证和答辩,确保课题实施的可行性。

(2)目标管理

经专家论证立项的课题,由科学数据库办公室负责组织签订《中国科学院重点项目课题任务书》,确定项目内容和目标,实行目标管理。

(3)过程控制

为了有效地促进科学数据库建设的发展,实现预定的目标,科学数据库办公室按照签订的合同指标,严格进行建设过程的控制。每年对课题组织年度工作检查,进行过程控制。一旦发现课题执行过程中的问题,及时提交专家委员会决策解决。

(4)滚动支持

科学数据库课题的管理,实行滚动支持。鼓励先进,淘汰落后,以便促进科学数据库事业的发展。

四、“十五”期间的发展

科学数据库及其应用系统作为中国科学院信息化建设的重要基础设施,已经纳入了中国科学院“十五”期间信息化建设的重大项目,给科学数据库的发展带来了一个有利的时机。

科学数据库及其应用系统在“十五”期间的总体发展目标是在继续扩大数据资源的基础上,促进数据向知识的转化,完善信息化的科学研究环境,初步建成面向科学研究和社会的科技信息服务体系。

1.建设任务

“十五”期间,科学数据库及其应用系统建设任务包括数据资源建设、标准规范建设和系统平台建设三个方面。

(1)数据资源建设

科学数据库数据资源建设是继续加强科学数据资源的采集和积累,扩大现有专业数据库范围,注重数据的完备性,系统性,内容和形式的多样性,在全院范围内逐步建立学科门类完整的专业数据库群体,为建设信息化的科学研究环境提供数据资源保障,为知识创新服务。主要任务是在全院范围内初步建成包括化学、天文学、材料科学、能源科学、海洋科学、生物学、地球科学、信息科学等学科门类基本完整的科学数据库群体,使科学数据库系统的建库单位的数量接近40个,学科门类逐步趋于完整;专业子库数量达到300个,专业库种类包括数值库、事实库和多媒体库;科学数据库总数据量达到10TB。同时,建成1-2个数字标本馆应用实验系统。

(2)标准规范建设

科学数据库标准规范建设是将科学数据库系统作为一个相对独立和完整的系统,研究、制定该系统相应的标准与规范,形成其特有的标准规范体系,用以规范化科学数据库数据资源的建设、数据共享与服务,保证数据资源的质量,提高科学数据库的管理和服务水平,为科学数据库的持续发展奠定良好的基础,为科学数据库实现从数据向信息和知识的转化服务,为科学数据库开发先进应用系统服务。在“十五”期间的标准规范体系建设包括数据标准体系、科学数据库元数据标准体系、科学数据库管理规范体系三大部分。主要任务是提交一套科学数据库标准规范。内容包括科学数据库元数据标准框架,科学数据库元数据标准集,科学数据库数据质量评估标准,科学数据库数据共享政策与规范等。

(3)系统平台建设

科学数据库系统平台建设是运用IT技术的新进展,对大规模、分布式、异构的科学数据库中海量的数据资源进行整合,实现全方位、深层次的资源共享,并在高性能环境的支持下开发基于科学数据库的先进应用系统,使科学数据库的发展能够满足未来科学研究的需要,使科学数据库能够成为未来信息化科研环境的核心组成部分之一。主要任务就是建设面向科学数据库未来五年发展需要的软硬件支撑环境;在数据整合与规范化的基础上,实现对数据资源的统一访问与充分共享;为科学数据库科技信息服务体系的建设和先进应用系统的开发提供有力的支持。同时,建立科学数据中心和专业领域数据分中心。通过建立数据中心提供科学数据库集海量存储、超级计算机、高速网络等软硬件一体化的信息共享平台,并对科学数据库建库单位提供技术支持和培训;通过建立专业领域数据分中心,规划、设计和集成专业领域数据库资源,逐步实现系统化和完备化,组织学科领域标准规范的制订和实施,进行学科领域数据分中心的系统平台建设,开展专业领域的应用,提供专业领域综合科技信息共享与服务。系统平台建设还要开发有典型意义的科学数据库先进应用系统。这些应用系统应能充分利用和发挥科学数据库数据资源的综合优势,成为未来科学研究工作中的重要工具或环境。

2.主要内容

(1)数据资源建设

·专业数据库建设

科学数据库“十五”期间资源建设从应用服务的角度出发组织专业数据库的建设。侧重于从学科领域整体规划数据库的发展,组织学科领域标准规范的制订和实施,注重数据的完备性,系统性,内容和形式的多样性,在全院范围内逐步建立学科门类完整的专业数据库群体,为建设信息化的科学研究环境提供数据资源保障。

——科研数据的采集与积累。将实验室、科研课题项目等科研活动中积累的科学数据和成果收集、整理、加工、建库上网,提供数据共享与服务。

——国外数据的合作交换。通过与国外同行科学数据的合作交换,建立互利互惠的合作关系,扩大专业领域的数据资源。

——建立国外数据库网上镜像节点。根据科学研究的需求,联系专业领域内国际上最权威的网上免费数据服务系统,在我国建立生物、天文等相应的网上镜像节点,实现在国内网上提供全球性科技信息资源共享。

·数字标本馆建设

中国科学院在生物和地学领域的研究所中分布着24个实物标本馆,其中相当一部分标本馆在国际上有很高的地位。数字标本馆是将原始实物标本系统地转化整理成易于传递的数字化电子信息,将标本在网上进行实物展示,具有很大的方便性和灵活性。数字标本馆的建设是一个新的探索,由于标本馆标本数量多,经费投入大,国内外尚无成功的范例。如何三维、直观和综合有效地展示标本的技术问题还有待探讨和解决。

“十五”期间,将在生物和地学领域选择1-2个标本馆,进行数字标本馆建设的试点工作。

(2)标准规范建设

·科学数据库元数据标准体系

科学数据库系统涉及的学科比较广泛,包括了数、理、化、天、地、生等多个领域,科学数据库系统数据资源的类型也多种多样。因此,不可能建立单一的科学数据库元数据标准,只能建立多种元数据标准共存的元数据标准集,在该标准集中不同的元数据标准间能实现一定程度的交换与互操作(Interoperability)。

此外,元数据标准集应该是一个开放的、可扩展的系统,随着科学数据库系统建设规模不断扩大,新学科、新应用不断产生,该标准集应能动态扩充。为此,我们将科学数据库元数据标准体系建设分成两个主要部分进行:

——科学数据库元数据标准框架。所谓元数据标准框架是科学数据库系统内制定不同学科、不同应用的元数据标准时应该遵行的规则、方法,它是抽象化的元数据,它从更高层次上规定了科学数据库系统中元数据的功能、数据结构、格式、设计方法、语义语法规则等多方面的内容。

——科学数据库元数据标准集。所谓科学数据库元数据标准集是科学数据库系统内针对各学科领域、各实际应用建立起来的元数据标准的集合。在该集合内发布的标准是各建库单位进行元数据建设时可以采用的标准。元数据标准集是一个开放的、可扩展的系统,随着科学数据库不断的扩大,新学科、新应用不断产生,可以不断地制定新的元数据标准并纳入到标准集中。

·科学数据库数据标准体系

建立科学数据库完整的数据标准规范体系是一项非常复杂的工程,在“十五”期间我们只是针对科学数据库的特点与需求,以软课题的方式,就以下一些方面进行研究,并且研究的重点在于数据质量的评估标准与相关的保证措施。

——科学数据库数据质量评估标准体系。数据质量包括数据的完备性、准确性等多个方面,数据质量的好坏直接影响数据应用者分析结果的可靠程度和系统应用目标的真正实现。科学数据库专家委员会在对每一个科学数据库进行检查和验收时,希望能有一套有效的方法来评估和检测数据的质量问题,对用户来说,科学数据的应用者在查询和利用数据时,也希望了解数据的来源与可靠程度。因此数据质量评估标准的研究与制定,将对科学数据库的发展起着重要的作用。

——科学数据库自身的评价与分类指标体系。科学数据库经过20多年的建设,一直没有明确提出什么样的数据是科学数据,什么样的数据库可以称为科学数据库;作为一个科学数据库必须具备哪些方面的特征;以什么样的标准来评价一个科学数据库建设的好与坏;科学数据库与其它数据库(如文献库等)的关系;不同的科学数据、科学数据库之间如何分类,不同的类之间有何种联系等等一系列的问题。通过研究和建立科学数据库自身的评价与分类指标体系,将解决上述这些问题,使科学数据库能成为一个自身完整的系统,为以后的研究与应用打下良好的基础。

——科学数据库标准术语和统一的数据词典。科学数据库中的各个子库是由不同的创建者建立的,所以一直以来没有统一的数据语义,为数据的整合和共享造成了很多的困难。因此,“十五”期间我们将在科学数据库的数据概念层上进行研究,建立统一的数据字典,保证能在异构,不同数据源的数据之间建立统一的语义关系。这样,就可以实现在异构的,分布式的数据环境下为用户提供统一的全局视图,以实现在多级数据管理系统上的数据整合。

——科学数据库信息编码体系。同类数据或信息采用相同的编码方式也是保证数据和信息能充分共享的条件,科学数据库信息编码体系分为科学数据库内部制定的信息编码体系和国际、国内信息编码体系。对于国际上或国内已经有的标准的编码方式,科学数据库采用国际、国内标准编码,对于科学数据库特殊需要的编码方式,在科学数据库内部制定并通用。

·科学数据库管理规范体系

科学数据库管理规范体系的研究在“十五”期间同样是以软课题的方式进行,其主要目的在于从宏观政策层面研究国际、国内关于数据共享、数据管理和服务相关的法律、法规、政策、规章等等,从而制定科学数据库系统内数据共享政策、数据服务政策、管理规范等。

科学数据库管理规范的研究可以分解为以下几个主要方面:

——科学数据库数据共享政策与规范。“科学数据库及其应用系统”十五期间在数据资源建设方面将涉及到近40个研究所,每一个研究所还涉及不同的课题组和大量的科研人员。对于这样庞大的一个系统,如何有效地进行数据的共享,不仅仅是一个技术上的问题,而且还涉及数据管理与共享的政策问题。研究和制定科学数据库数据共享的政策与相关的管理办法,可以保证在科学数据库系统内数据资源的充分共享,也保证基于这些数据所开展的各种信息服务的质量。

——科学数据库管理规范体系。科学数据库本身是一个复杂的系统工程。它的管理问题贯穿在主体库的建设和运行服务之中。因此,要根据过去的经验和未来发展的趋势,对科学数据库提出一套符合管理科学的理论,又适合科学数据库特点的管理体系。在科学数据库数据中心 - 各学科分中心 - 专业数据库三个层次都提出相应的管理规范。

——科学数据库运行服务体系。运行服务体系是建立科学数据库的重要目标之一。采取什么样的运行服务机制是一个十分复杂和敏感的问题,因此,在“十五”期间我们将在实践的过程总结和建立一套多级运行服务机制。

(3)系统平台建设

“十五”期间科学数据库及其应用系统项目的系统平台和应用系统建设任务包括以下五个部分:一个数据中心;三个数据分中心;科学数据库系统平台软件开发;科学数据库系统平台建设;先进应用系统建设。

·科学数据中心

科学数据库数据中心具备由海量存储资源、高性能计算资源、高性能网络资源和多媒体处理资源等组成的高性能环境,可作为科学数据库信息服务体系的集中服务点,并且可为科学数据库先进应用系统提供支持。同时,数据中心还是建设科学数据库系统平台的牵头单位,负责科学数据库系统平台软件的开发,并指导其他建库单位的建设工作,提供技术支持服务。

·三个数据分中心

“十五”期间拟建三个科学数据库数据分中心。数据分中心通常是该学科领域内的代表性的建库单位,具有相当的数据存储和处理能力,并且可能具有某些该学科领域内的特殊资源,在资源共享方面具有较强的提供能力。 同时,数据分中心也负责在该学科领域内科学数据库系统平台的建设,并提供一定的技术支持服务。

·科学数据库系统平台软件开发

科学数据库系统平台是十五科学数据库建设的核心内容,它是科学数据库关键支撑技术的集成,在科学数据库数据资源积累、整合、优化的基础上,为先进应用系统的开发提供关键的支持。十五期间科学数据库系统平台软件的主要目标就是建立科学数据库社团内的统一安全体系,实现科学数据库分布式、异构资源的统一访问接口。系统平台软件主要包括三个部分:科学数据库安全体系,元数据管理与服务系统,科学数据库统一访问接口。

·科学数据库系统平台建设

科学数据库系统平台建设的主要任务就是将系统平台软件应用到科学数据库数据中心、数据分中心和各建库单位,并负责这个系统平台的运行管理。

·先进应用系统

“九五”末期,科学数据库先进应用系统的开发提上日程,具有典型性的应用系统有:虚拟博物馆,虚拟实验室,网上科技信息交易市场,和数字标本馆等。目前,虚拟博物馆,即中国科普博览,的建设已初具规模,并成为院十五信息化建设项目之一。数字标本馆的建设被列为科学数据库数据资源建设的项目之一。本方案中包括两个先进应用系统:虚拟实验室,网上科技信息交易市场。

随便看

 

百科全书收录4421916条中文百科知识,基本涵盖了大多数领域的百科知识,是一部内容开放、自由的电子版百科全书。

 

Copyright © 2004-2023 Cnenc.net All Rights Reserved
更新时间:2025/3/1 18:22:29