《中国知识资源总库》基础信息库资源建设规划

  根据数据库的用途、信息加工深度和知识信息形态划分,《中国知识资源总库》(以下简称《总库》)分为三个层次,即基本信息库、知识仓库、知识元库。基本信息库是构成总库知识资源的基石,包括《中国期刊全文数据库》(CJFD)、《中国优秀博硕士学位论文全文数据库》(CDMD)、《中国重要会议论文全文数据库》(CPCD)、《中国重要报纸全文数据库》(CCND)等,以及各种涉及自然科学、工程技术、人文与社会科学的源数据库,如各种年鉴、史志、多媒体资源、科普、教参资料、互联网知识信息等。

  经过八年的积累,《总库》基本信息库已经形成了较好的基础,并为科学技术研究、各级各类教育以及社会各方面的知识学习和知识创新提供了广泛的知识服务。

一、 规划目标

1、总体目标:完成国内80%的公共知识资源的数字化,国内馆藏国外知识资源的50%数字化,建设超大容量的信息资源,形成一个基于知识网络和知识服务网络的开放式知识资源体系,为全社会的知识生产、传播、扩散提供全程服务。
2、完成期限:
3年(2004年—2006年)
3、规划内容:

■自然科学与工程技术类知识资源
 《中国期刊全文数据库》(CJFD)
目前,国内正式出版的科技期刊共4449种。2003年底收录期刊达到4300种,累计文献量达到714万篇;2004年起年更新90万篇以上,2006年将达1100万篇,收全率达到98%以上。
 《中国优秀博硕士学位论文全文数据库》(CDMD)
我国现存科技类博硕士学位论文约60万篇,其中博士论文和优秀硕士论文约12万篇。目前已收录其中283个博士培养单位2000年~2003年的博士论文和优秀硕士论文6万篇,2004年起年更新约4万篇以上。至2006年底,将累计收录论文23万篇。
 《中国重要会议论文全文数据库》(CPCD)
2003年收录10万篇,2004年起年更新8万篇以上。到2006年年底,将累计收录全国会议论文75万篇。
 《中国重要报纸全文数据库》(CCND)
报纸发表的科技类学术与知识类文献较少,主要集中在200余种重要报纸上。《中国重要报纸全文数据库》(CCND)已选载2000年6月以来60万篇科技文献,2004年起年增30万篇以上。2006年收录重要报纸上有学术价值的科技文章累计达到180万篇。
专利
我国现有专利约60万件,年增加30万件。2006年将达260万件。本库从有关单位引进。

■人文与社会科学类知识资源
 《中国期刊全文数据库》(CJFD)
2003年底收录人文社科类期刊2300种, 430多万篇全文文献;2004年起年更新50万篇以上。2006年累计达到800万篇。
 《中国优秀博硕士学位论文全文数据库》(CDMD)
已收录2000~2003年论文4万篇,2004年起年更新2万篇以上。2006年累计达到15万篇。
 《中国重要会议论文全文数据库》(CPCD)
现存人文社科类学术会议论文约120万篇,其中有实效性和利用价值的约5万篇,现已收录2万多篇,2004年起年更新1.6万篇以上。2006年累计达到15万篇。
 《中国重要报纸全文数据库》(CCND)
人文社科类报纸文献大约分布在600多种报纸上,目前CCND已经选择收录了500种报纸的220多万篇文献,2004年起年增加90万篇以上,2006年将累计达到720万篇。

■ 《中国图书全文数据库》(CBFD)
国内现存中外图书约630万余部,其中有开发利用价值的约500万部,2003年收录12万种,年增加100万种,2006年达到390万种。

■年鉴
2003年收录2000年以来的年鉴2000多种。三年后总量达到8000种。

二、建库模式

1、资源来源
  出版政策许可原则
  所有收录内容必须符合国家新闻出版有关法律法规和政策原则。
  学科范围
  涵盖自然科学、工程技术、人文社科所有学科领域。
  知识层次
  包括学术、应用、基础与常识性知识。
  资源类型及收录完备性指标
(1) 传统出版物:
  图书、期刊、报纸、会议论文集等出版物。平均收全率为90%以上。
(2) 未公开出版作品
  博硕士学位论文、学术会议论文等未公开学术作品。平均收全率为80%以上。

2、建库方式
  收录:通过与编辑部合作,将已经出版公开的图书、期刊、论文、报纸合理的收录,加工成不同类型的基本信息库。
  录用:依据一定的录用标准,选择质量保证的优秀论文或著作直接在网上出版。这种方式主要用于学位论文和会议论文的出版。
  链接:基于引文、内容等建立链接,作为门户,指引到其他数据库,联合提供信息服务。

三、知识网络结构

1、微观知识网络(短程关联)
(1)引文(注释)链接
  引用链接与被引链接:根据引用的关联强度,均分为强引用(依据性)、弱引用(背景性)两类。
  共引链接:同一文献被若干文献引用。按共引文献数量可分为若干级聚类强度。
(2)知识元链接
  注释型链接:在文献中知识元名称处链接该知识元内容。
  关联型链接:将高频次共用同一知识元的文献进行链接。
  复合型链接:通过注释型链接,实现关联性链接。
(3)作者群关联
  将同类文献的作者聚类,并将其文献进行链接。此外,还包括作者单位链接、基金链接等。

2、介观知识网络(近域关联)
(1)项目关联
  将文献按研究项目分类,将同类、同项目、关联项目的文献链接。
(2)内容聚类
  基于知识表示理论和方法,以及不断维护的词表,进行内容自动聚类。
(3)知识分类体系
  不同于传统的图书分类法,知识分类体系是基于现代科学理论和认知理论,参照教育部制订的学科分类,由各学科专家编制的知识分类体系,据此对资源进行知识层面上的分类。由此实现《总库》的知识导航。
  同时将保留图书分类体系。

3、宏观知识网络(长程关联)
(1)学科交叉
  两个或两个以上学科交叉产生新的学科,要及时在分类体系中加入。
  在交叉学科的研究中,必然引用原学科的文献,可标注交叉性引用。同时,对交叉学科文献进行知识元交叉链接。
(2)学科渗透
  在某一学科中引进其它学科的知识称为学科渗透。分类体系中加入新的学科分支,并进行渗透性、引用性链接和知识元链接。

四、著作权解决方案

1、 著作权使用许可与授权渠道
●收录型资源
  期刊:与编辑出版单位签订协议,取得编辑者汇编作品著作权和版式权使用许可。通过编辑出版单位取得作者著作权使用许可并付稿酬。
  报纸:据最高人民法院《关于审理涉及计算机网络著作权纠纷案件使用若干法律的解释》依法转载,直接或间接通过著作权集体管理组织支付稿酬。
  图书:根据收录图书不同的法律状态,采取不同的著作权解决方案:
  版权或已超出保护期限的图书:通过图书馆等图书收藏机构采集样本图书。
  已出版的著作权保护期内的旧图书:通过资源共建共享、发行服务、互惠互利等合作服务方式,合法取得作者与出版者的使用授权。
  新出版图书:通过与出版社的合作协议取得出版者与作者的使用授权。
  国外图书:提供代办发行,签订合作协议,取得授权。
●出版型资源
  对于没有公开过的作品,包括图书、学位论文和会议论文,解决版权比较负责,不能仅仅得到作者所属单位的单方面许可,同时还要获得相关作者、著作权人的同意,支付相应的版权费用,才可以在网络上出版、发行。
  博硕士学位论文、会议论文:通过研究生培养单位取得该单位和相关著作权人的使用许可,并直接或间接支付稿酬。
  图书:网络出版,直接与作者签订著作权出版授权。
  学位论文:参照执行期刊出版的稿件处理规则。

2、著作权使用费标准和支付办法
  国内作品暂按国家版权局国权(2000)19号关于同意试行《制作数字化制品著作权使用费(试行)》的批复,以版税率5%—15%的标准范围支付著作权使用费。支付标准在上述标准和原则下,按不同类型作品,依授权许可协议、合作协议和合同依法支付。海外作品根据著作权使用许可协议规定的标准执行。

五、资源建设合作路线
   建设《总库》的主要目的之一是支持各单位的信息化建设。为了满足各单位知识管理与自建知识资源的需要,《总库》基础信息库将对合作单位公开数据结构,通过合作协议方式,授权有关单位对《总库》基础信息库数据进行增值性二次开发和综合利用,并提供有关技术支持;以《总库》为枢纽,将基础信息资源、知识仓库资源与各合作单位数据库在知识元、引文等层次上进行链接,通过合作协议产品化共享使用;各单位数据库和各类知识资源可通过《总库》网络出版平台进行网络出版发行。

                           (《总库》编委会资源建设委员会供稿)