《中国知识资源总库》简介

一、 建设背景与目标

1、 国家与社会需求

  知识资源的整合与传播是知识创新与应用的基本条件,是知识生产力的关键要素之一,也是社会文明进步的主要动力,其手段和方式决定着知识生产与应用的效率与水平,是社会不同发展时代的重要标志之一。因此,改进知识资源整合与传播的手段和方式,往往被很多国家视为促进社会文明进步和国家科技经济发展的重要国策。活字印刷技术、《永乐大典》、《四库全书》曾经改变了我国乃至世界的文明进程;基于现代信息基础设施的 “国家知识基础设施(NKI)” 、“数字图书馆”的出现,使发达国家的知识传播进入了适应知识经济的信息时代。国家“十五”计划的信息化专项强调了加强公共信息资源的社会共享。正在制定之中的《国家中长期科技发展规划》也在酝酿,把以实现知识资源社会共享和网络化科技研究环境为主要建设目标的“国家科技发展平台”列为重要内容。

2、《中国知识资源总库》建设目标

(1)定义
  《中国知识资源总库》,简称《总库》,是具有完备知识体系和规范知识管理功能的、由海量知识信息资源构成的学习系统和知识挖掘系统。
注释:

 知识资源
  《总库》所包含的知识资源限于显性知识范畴,包括知识信息资源和信息化了的物化知识资源。其中,知识信息资源是用文字表达的知识要素;信息化了的物化知识资源是用多媒体信息表达的物化知识,如音乐、图片、录像、录音、动画、模拟软件等表达的知识要素。

  《总库》知识层次包括生活常识和科学知识,包含经验知识和理论知识;知识领域覆盖自然科学、工程技术、人文科学、社会科学。

 *中国
  是指本库是中国自主知识产权的;本库的知识资源主要取自中国;本库主要为中国的需要而设计。

 *总库
  指本库内容全面、系统,经过汇编、改编和技术处理形成整体,可综合利用。《总库》计划收录我国各类知识资源的80%以上。

(2)总体描述
  《总库》将不断集成整合、汲取补充国内外各类知识信息资源,力求囊括国内外自然科学、工程技术、人文与社会科学各个学科专业领域的所有研究成果和知识内容,提炼知识精华,梳理知识结构,建立知识网络,构造各种类型的智能化知识学习和知识挖掘模型,为科学技术研究、各级各类教育以及社会各方面各种层次人群的知识学习和知识发现提供全面的知识服务。

3、 《总库》建设资源基础

  历经八年不懈努力,中国学术期刊(光盘版)电子杂志社已经建成文献总量为1200多万篇的一系列全文数据库,正在建设将拥有500万本图书的《中国图书全文数据库》和拥有1800多万条记录的知识元数据库,并利用“分布异构跨库统一检索平台”和“知识元链接”、“引文链接”等技术手段,在互联网上与600多个国内外数据库相关联,形成一个基于知识网络和知识服务网络的开放式知识资源体系。
  中国学术期刊(光盘版)电子杂志社现已建和在建的主要知识资源有:

(1)基本信息库
 《中国期刊全文数据库》:国内6500种学术期刊自1994-2003年共10年的全部文献,约1100万篇,每年约新增110万篇。
 《中国优秀博硕士学位论文全文数据库》:全国320多个博士培养单位2000-2003年博硕士学位论文,约11万篇,每年新增约6万篇。
 《中国图书全文数据库》:正建500万种图书的全文库,其中国内图书约260万种,国外图书约230万种;年增国内外新书约30万本。
 《中国重要会议论文全文数据库》:各大学会、政府、高校学术会议论文约50万篇,年增约20万篇。
 《中国重要报纸全文数据库》:500种重要报纸280多万篇,年增约120万篇。
 《中国年鉴全文数据库》: 2000多种年鉴的全文数据库正在建库。
 《多媒体教育教学素材库》:已建成供中学使用的多媒体资料20万条。
 互联网上的信息资源:正在采用智能采集编辑系统自动搜索建库。

(2)知识仓库
 《中国医院知识仓库》:已有340万篇文献,年更新约40万篇。
 《中国企业知识仓库》:已有10个行业数据库,共400万篇,每年更新约80万篇。
 《中国基础教育知识仓库》:已有200多万篇,年更新约50万篇。
 《中国政府知识仓库》:正在建设中,文献量约500万篇。

(3)知识元库
 数值型知识元库:从科学数据库、年鉴、期刊中抽取,约可达1000万条。
 理论与方法型知识元库:从期刊、博硕士论文、图书、报纸、百科全书等数据库中抽取。总量约可达300万条。
 事实型知识元库:从图书、期刊、博硕士论文、报纸、年鉴、地方志等数据库中抽取。总量约可达500万条。

二、建设方法与《总库》框架结构

1、 建设方法

  不同于过去以信息为对象的资源建设思路,《总库》是以知识为对象建设的,追求的是知识体系的完备性、知识的高度可挖掘性和资源的可增值性,需要根据各学科发展的时代特征,建立新的知识体系,系统、完整、及时地组织和加工处理知识信息内容。
基本建设方法是:
 全面、及时采集知识信息资源,建成完备的基本信息库。
 由各学科专家根据知识体系结构和知识发展脉络对基本信息进行梳理,确认新的知识点及其在相关知识体系中的地位。
 将新的知识提炼为知识元,与其出处一并组织到知识体系之中。
 通过知识元的规范化表述与引文链接的方法,建立知识关联关系。
 利用智能知识挖掘技术实现知识发现。

2、 框架结构

  《总库》在内容上采取“三层知识网络结构”,各层数据库可独立使用,也可作为整体使用。数据结构采用国际标准,可以和国内外各类标准、非标准结构数据库在统一检索平台上同时使用。

第一层:基本信息库
  基本信息库由各种源信息组成。如期刊、博硕士论文、图书、报纸、专利、标准、年鉴、图片、图像、音像制品、数据等。该库按知识分类体系和媒体分类体系建立,可以直接使用。

第二层:知识仓库
  根据专业用途和学科知识体系构建。由专业用途界定知识仓库的知识范畴和层次,由学科知识体系确定知识模块、知识点及其具体内容。内容可以从基本信息库中选取。如《凝聚态与统计物理知识仓库》、《材料科学与材料制造技术》、《中国医院知识仓库》、《宏观经济学与经济政策分析》等。各知识仓库可以独立使用。

第三层:知识元库
  由具有独立意义的知识元素构成。包括理论与方法、事实、数值型三类基本知识元。知识元数据库可以独立使用,也可以与基本信息库、知识仓库关联使用。
  理论与方法型知识元:包括思想、方法论、概念、公理、原理、定律,以及正在探究中的观念、观点、理念;具体方法与技巧等。
  事实型知识元:自然、社会存在和演变的事实信息。
  数值型知识元:各种具有知识意义的数据和科学数据,具有数值分析和知识推理功能。
  通过知识元库和引文链接等各种知识链接方法,《总库》三个层次的内容将可融为一个具有知识网络结构的整体。

三、《总库》的增值服务

  《总库》除了具备通用的检索、浏览(包括多媒体播放)、编辑、输出等基本功能外,还具备以下使信息增值的服务功能:

1、知识服务网络
  《总库》与国内外数据库以及传统图书馆藏的联合目录数据库进行链接,读者可以在使用《总库》的同时,调用与其链接的各类资源。

2、智能化检索
  《总库》具有智能聚类功能,可以根据读者定义的知识类别将信息自动分类。

3、可视化知识分析
  在数值型知识元数据库中,可以通过读者设定的问题分析方法,提供知识视图。

4、智能参考咨询
  可以利用知识库自动答疑,或由专家在线答疑。

5、个人数字图书馆
  为读者提供个人资料的建库、网上发布、数据库管理等技术服务。

6、知识学习平台
  根据不同层次、不同人群的学习习惯,提供知识获取平台,以及网上实时探究、讨论的多媒体协作学习平台。

7、协作研究平台
  为研究人员提供多功能视频网络会议平台,人们可以实时调用《总库》资源,进行语音、文字、图像、视频方式的科学研究活动。

8、科技查新平台
  可以同时调用各种科技信息,并对各数据库进行信息完备性和检索性能的检测,通过规范操作精确查新,为科研立项管理、项目验收管理等提供可靠的决策信息。

                          《中国知识资源总库》编委会技术委员会
                            中国学术期刊(光盘版)电子杂志社
                                    2003年10月