中国科学院科学数据库共享技术与政策
|
日期:2005年5月6日 作者:阎保平 肖云 人气:
查看:[大字体 中字体 小字体]
|
共享和应用始终是科学数据库及其信息系统(以下简称科学数据库)的核心价值和发展方向。以互联网为代表的信息技术迅猛发展及广泛应用,给科学数据库的传统共享服务带来了巨大的冲击。共享还是保护,网络环境下应该如何共享,是科学数据库“十五”建设面临的重大课题。同时,这也是一个绝好机会以检视20多年来的科学数据库资源建设、应用服务的现状和不足,研究解决科学数据共享的整体战略。近两年来,在中国科学院有关领导的大力支持和科学数据库专家委员会的指导下,科学数据库中心承担的科学数据库系统平台、标准规范等项目建设取得了长足的进展,就科学数据共享建设的技术条件、数据政策和数据规范进行了卓有成效的创新工作,取得了一些重要的阶段性成果。
一、科学数据库发展与应用历程
自上个世纪八十年代,中国科学院提出了“科学数据库及其信息系统”的建设项目,旨在将科学研究中积累的、各个专业的科学数据通过不断发展的计算机技术、数据库技术和网络技术加以管理、开发和应用。1986年,科学数据库被国家计委列为国家“七五”和“八五”期间的重点工程项目.同时,中国科学院将其列入“七五”院重大项目和“八五”、“九五”院基础研究特别支持项目,其中“系统网络软件开发”作为国家基金委1995年网络应用重大项目予以支持。
2001年,科学数据库列为中国科学院“十五”知识创新工程信息化专项建设,2003年,科学数据库列入科技部“科学数据共享工程”试点建设。
经过二十年来的建设与发展,科学数据库已经成为目前国内信息量最大、学科专业最广、服务层次最高、综合性最强的科学信息服务系统。科学数据库的内容涵盖了化学、生物、天文、材料、腐蚀、光学机械、自然资源、能源、生态环境、大气、遥感等多种学科,据统计,截止2003年10月底,总数据量累积达到8.2TB,其中上网数据量4.3TB,专业建库单位45个,专业数据库313个,全国各地建立了40多个WEB站点,并通过中国科技网与系统总站(www.csdb.cn)实现资源的集成管理与服务。科学数据库已在国家经济建设、国防建设、规划决策、科学研究、科技攻关、学科发展、国际合作等诸多方面得到应用,取得了显著的社会效益和一定的经济效益,在国内外产生了影响。
二、科学数据共享现状与发展趋势
我国在科学数据共享问题上已经采取了积极的措施。2001年,科学数据库在“十五”规划中,标准规范和数据资源、系统平台同时列为三个其中的核心建设内容。2002年11月,香山科学会议第196次“中国科学数据共享”学术讨论会召开,2003年科技部启动了科学数据共享工程,开始系统性建设面向全社会的数据共享服务体系。
国际上,美国、欧洲等西方发达国家先后启动了有关科学数据共享的研究,内容涉及科学数据的采集、管理、分发、使用与服务等多个方面,制定了一系列的信息共享法规。当前,国际上科学数据共享的主要运行机制有两种基本模式:国家调控下的事业性运行模式和商业化运行模式。事实上,在所有的国家这两种模式都是并存的,不同的是两种模式所占比重不一样,欧洲国家偏重于对数据权益的保护,如欧盟1996年推出了“数据库法律保护指令”。
同时,国际重要的科学组织也密切关注着数据共享问题,1997年6月,国际科学联合会(ICSU)和国际科技数据委员会(CODATA)联合成立了数据与信息特别任务组(ICSU/CODATA ad hoc Group on Data andInformation),对科学数据库权益保护就法律、经济和科技等方面提出专业建议。ICSU和CODATA发布了支持科研教育领域实行完全与公开(FULL AND OPEN)数据共享核心原则,供有关数据传播立法、共享活动参考。此外,其他的国际科学组织也相继在本领域内开展数据共享研究、探讨,如世界数据中心、世界气象组织等。
三、科学数据共享技术与政策
在数据共享及其政策规范逐步成为全球热点的情况下,科学数据库将标准规范列入十五期间的核心建设内容之一,与系统平台和资源建设一起促进数据共享的整体解决方案。总体目标是在继续扩大数据资源的基础上,促进数据向知识的转化,完善信息化的科学研究环境建设,初步建成面向科学研究和社会的科技信息服务体系。
1、数据资源建设
继续加强科学数据资源的采集和积累,扩大现有专业数据库范围,在全院范围内逐步建立学科门类完整的专业数据库群体,为建设信息化的科学研究环境提供数据资源保障,为知识创新服务。
2、标准规范建设
通过顶层设计、科学规划和系统研究制定科学数据、数据库及应用的相关技术标准、元数据规范、质量控制和共享政策措施,为科学数据库的持续发展奠定良好的基础。标准规范建设由计算机网络信息中心牵头承担,统一组织建库单位协同研制并具体应用。
标准规范体系建设包括数据标准体系、科学数据库元数据标准体系、科学数据库管理规范体系三大部分。“十五”期间,主要研究包括科学数据库元数据标准框架、元数据标准集、数据共享政策以及数据质量控制等。
3、系统平台建设
运用IT技术的新进展,对大规模、分布式、异构的科学数据库中海量的数据资源进行整合,实现全方位、深层次的资源共享。在高性能环境的支持下开发科学数据库的先进应用系统,使科学数据库成为未来信息化科研环境的核心组成部分。
标准规范建设通过以科学数据库相对独立和完整的系统为研究对象,分析制定该系统相应的标准与规范。研究科学数据库的共享服务,分析数据共享的政策基础,制定数据共享的实施办法是标准规范建设的主要工作之一。在2003年4月通过专家认证后,该项研究展开了紧张的工作,迄今举行了三次数据共享研讨会,并于2004年先后启动了地学、化学、生物学领域数据共享政策研究,取得了重要成果。2003年,科学数据库中心依次发布了“国内外科学数据共享政策研究报告”、“科学数据库数据共享办法(草案)”、科学数据库数据共享办法(征求意见稿)等研究报告。2004年8月,正式发布了“科学数据库数据共享办法(试行)”(以下简称共享办法)和科学数据库数据共享服务声明,并建立专门站点宣示科学数据库数据共享政策及学科领域共享说明,贯彻执行科学数据共享办法。
共享办法框架设计为10章共52条,内容包括:总则、科学数据共享管理机制、分类分级、发布与共享、科学数据集中、集成管理、用户分级、使用与知识产权保护、奖则与罚则、附则,以及附录(名词术语)。主要从管理机制、数据共享角色和共享方式等主要角度定义了数据共享活动中相应的原则、权利和义务、职责和约定。
1、科学数据共享原则
共享办法强调,在不损害国家和建库单位的利益、有效保护其知识产权的前提下,数据资源应通过各种方式向全社会分级分类发布,促进科学数据以尽可能小的代价自由的共享和合理的使用。
2、管理机制
共享办法确定了科学数据库专家委员会、数据中心、建库单位、数据用户等四个方面构成的管理机制,明确了数据中心作为科学数据库产出科学数据及其成果的永久性集中寄存处地位,主要在专家委员会的管理和协调下,建库单位和数据中心进行开发、整理、集中、发布所拥有的数据信息,提供数据的保存、增值、管理和服务的基础条件,保证和促进最终数据用户自由存取和合理使用科学数据。
3、共享角色及其权利义务
从数据共享主要角色出发,共享办法对数据共享管理机制和共享活动中的各类行为规范进行了约定,在现有法源的基础上,重点解决有关数据权益问题。
按照行为特征,共享办法中所称的主要角色是指数据生产者、提供者和最终使用者,但并不是简单对应于是建库单位、数据中心和数据用户。实际上,具体的角色实体可能具有多种、各类共享行为,如既是生产者,又是数据用户,还有可能是数据提供者,对此,共享办法是按照共享行为对共享实体角色进行定义和规范。如数据生产者拥有知识产权,也负有发布和共享数据的义务;提供者和数据用户不能侵犯知识产权,但拥有自由共享和合理使用数据的权利。
4、发布与共享模式
通过深入分析科学数据内涵,以科学数据的内容属性及其特征划分确立为数据共享与发布原则的重要依据。共享办法指出,数据资源应该根据学科属性、分级分类、加工形态、用户对象的具体情况,确定其特定的发布与共享形式。共享方式包括非授权完全无偿共享、授权无偿共享、收回数据服务成本共享和有偿共享四类,发布形式则有在线完全发布、在线部分发布、在线发布元数据以及离线共享等。
5、知识产权保护
共享办法明确了生产、提供和共享使用科学数据的有关知识产权问题.规定通过中国科学院“科学数据库”项目支持建立的各主体数据库及其子库,建库单位原则上拥有所有权和优先使用权。中国科学院享有对“科学数据库”项目支持建立的各主体数据库及其子库中的数据无偿和无限制的使用权,并授权“中国科学院科学数据库专家委员会”行使其使用权。其他对科学数据的开发、使用、利益回报等行为,应经专家委员会或相应建库单位的书面许可,并注明引用来源,或根据契约合同进行分配。
6、激励措施
主要通过科学数据库项目管理办法以及专家委员会的监督指导,对数据共享工作进行定期检查,根据共享服务工作的成绩和问题规定了相应了处理措施。
综上所述,共享办法(试行)不再是一种简单的行政管理模式,与共享办法的草案文本有了很大改进,从而贴近了科学界传统的合作与交流精神,具备更好的实践操作性。
共享办法为科学数据库数据共享提供行动指南,在当前相关法律空白的情况下堪称是科学数据库共享服务的“根本XX”。
四、科学数据库共享服务发展规划
科学数据库的发展趋势是向更大程度的数字化、集成化和网络化方向发展,并向使用者提供统一的、全方位的、透明的数据服务,数据管理与服务也在向标准化、规范化方面发展。因此,各种数据格式标准、数据交换标准、元数据标准、数据共享技术等已经成为信息科学的研究重点,也是科学数据库需要重点解决的课题。
1、将研究大规模分布式异构数据库群的特点,应用高速网络与计算网格技术,开发特定的数据网格中间件,为科学数据的共享服务提供先进解决方案。
2、积极研究科技数据的交叉融合,发展各种专业的数据标准规范,实现科学数据的跨学科交联与集成,不断创新知识和技能,进行科技数据增值,增强科学数据库的综合服务能力和竞争力。
3、推动完善和执行数据共享办法,研究学科领域的数据共享实施方案,把科学数据库的发展规划和共享服务紧密结合,在项目建设任务中将进一步明确数据共享工作内容。
4、“十五”建设的创新开发,把科学数据库与高速网络、超级计算相结合,加快建成我国e-Science数字化科研环境,支撑21世纪的国家科技创新。
科学数据共享是在国家发展的迫切需求和信息技术迅猛发展的背景下产生的,是崭新的共享管理与发展理念。通过科学的规划实施,科学数据库业已取得的初步成绩表明,在数据共享复杂工程上已经跨出了突破性的第一步。随着工作的深入推进,科学数据库将全面发展并增强资源、技术、政策、机制和人才等基础条件,鼎力创新数据共享应用和可持续发展建设,为科技、经济和国家综合国力发展服务,最终实现科学数据繁荣共享的伟大创举。(出处:《科学中国人》) [推荐给朋友] [关闭窗口]
|
|
|
请您注意:
·遵守《全国人大常委会关于维护互联网安全的决定》及中华人民共和国其他各项有关法律法规。
·尊重网上道德,遵守中华人民共和国的各项有关法律、法规。
·承担一切因您的行为而直接或间接导致的民事或刑事法律责任。
·网络管理人员有权保留或删除其管辖发言中的任意内容。
·您发表的言论,我们有权在网站内引用或转载。
·参与发言,表明您已经阅读并接受上述条款。
|
|
|
|
↓ 特别推荐 |
|
|
|
 |
|
↓ 热点TOP10 |
|
|
|
 |
↓ 相关文章 |
|
|
|
 |
|