关于《CNKI系列数据库产品标准》的说明
同方知网知识传播工程技术研究院标准化研究室


   “CNKI系列数据库”是一系列以网络和光盘载体定期连续出版的全文文献与多媒体数据库产品,属新闻出版总署批准正式出版的国家级电子与网络期刊。该产品以三种版本连续出版:“中心网站版”每日更新、累积发布于“中国知网”(WWW.CNKI.NET);“镜像数据库版”发布在用户内部网,按月用DVD-R光盘或每日通过互联网向机构用户提供更新数据;按月提供更新数据的“光盘版”在用户小型局域网上发布使用。

  《CNKI系列数据库产品标准》,下简称《标准》,是由该产品的编辑出版单位(中国学术期刊(光盘版)电子杂志社)、技术提供与发行单位(同方知网(北京)技术有限公司)和数据制作单位(清华同方光盘股份有限公司),参照国内外有关技术标准和传统出版物的产品标准,联合制定的企业级出版产品标准,也是国际国内首部公开发表的连续电子与网络出版物产品标准。因此,本标准的技术设计和文字表述等各方面一定存在不少不尽人意之处需要不断改进和完善,希望得到专家、用户和读者的批评指正。

  本标准的征求意见稿将在“武夷山《CNKI系列数据库产品标准》研讨会”上印发,会议之前将在“中国知网”发布。为了便于讨论,本文先就《标准》有关问题作简要说明。

1. 关于《标准》的结构
  目前,本标准覆盖的产品包括《中国期刊全文数据库》、《中国优秀博硕士学位论文全文数据库》、《中国重要会议论文全文数据库》、《中国重要报纸全文数据库》、《中国图书全文数据库》等源数据库,和《中国医院知识仓库》、《中国基础教育知识仓库》、《中国企业知识仓库》等知识仓库型数据库,新产品的产品标准还将不断纳入。《标准》从全文数据库基本属性、产品用途、内容、结构、功能与性能六个方面定义和描述产品,规定相应的内容与技术指标,从而定义产品质量。鉴于本产品的连续出版属性及其质量对复杂技术与技术服务的依赖性,以及企业标准的合同约定强制执行性,故将“技术服务标准”、“产品质量保证措施”一并纳入了产品质量标准范畴。

2. 制定产品标准的必要性与意义
   标准化是法制化市场经济体制对各行各业的必然要求。期刊、图书、报纸等传统出版物在内容和形式方面均有相应的产品标准与质量监督保障措施,光盘、网络的信息存储与传输也有许多国际、国家标准,数字文档、文档型数据库在元数据结构等各方面的技术标准正在不断发展。但截至目前,作为数字化内容产品的产品标准和产品质量标准还没有公开出现。绝不是由于用户不需要,恰恰相反它是资源传播、利用、保存等各方面所非常必要的基本条件。究其原因主要是电子与网络出版产业本身和相关法制的不成熟。

  从传播功能来说,这类产品不同于直观传播的传统内容产品,用户使用产品需要凭借计算机与网络系统以及自身信息素养,没有用户公知、熟知的产品标准,用户将难以了解它的内容,甚至不能正常使用。尤其是大规模集成且不断更新的知识资源类数据库,其内容检索的价值观与方法论都显著不同于新闻网站和搜索引擎网站。尽管人们需要个性化信息服务,但没有标准的资源产品绝不可能满足广大用户的个性化服务要求。

  就利用价值来看,最终用户对这类产品的质量要求,主要来自从事知识创新及其管理、国情国策调研、情报搜集分析等与重要决策有关的工作,或出于专业知识学习、课程教学改革等意义重要的需要。

  按收藏价值来讲,各类学校、科研、医院、政府、企业等机构对这类产品的质量要求,主要是为了创建信息资源共享保障体系和现代化工作学习条件与环境,也为了依此从事支持决策和学习的知识管理与知识服务。人们对产品越来越高的要求表现在:产品的软硬件应用环境,内容出版范围、质量与速度,检索功能与性能,数据质量、二次开发利用与保存价值,知识挖掘、知识发现的能力,资源集成整合的整体增值效果,数字化学习与研究等各个方面的增值利用功能与性能。

  CNKI系列数据库目前是国内外应用层面最广、使用人数最多、检索下载频次最高、图书馆收藏量最大的中国文献数据库。我国科技部、卫生部已将CNKI科技期刊数据库等列为科技查新必查库,美国国会图书馆、德国国家图书馆等国家级图书馆已将CNKI系列数据库定为永久性馆藏资源,我国党和国家省部级以上机关、美国白宫与国防部、台湾各党派高层组织、各国驻华使馆等国际国内政界均已将其用作长期跟踪使用的战略资源。

  综上,对CNKI工程来说,产品标准的及时制定已经成为当前最重要的工作之一。无论出于对市场还是对人类文明负责,清华大学与清华同方都有义不容辞的责任与义务,制定好产品标准,切实保证产品质量,把用户、国家、国际国内社会的现实和永久性需要与要求,严格地体现于产品的研制和服务过程之中。也只有如此,企业才能把知识资源的电子网络出版传播真正做成一个社会需要的规模化产业,才能长远地实现其社会和经济价值。

3. 产品标准的制定目标
   从信息化的技术本质、社会文化本质及其发展趋势看来,数字化的知识文化信息将是未来社会必然需要、必然出现的一种全新信息形态。与传统文字、图形图像、音频、视频等信息形态相比,它具有数字化、网络化属性带来的无可比拟的整合传播优势,譬如极强的多媒体内容表现能力、互动传播能力、知识挖掘能力、集成整合增值利用能力等。因此,数据库产品的功能和作用必将远远超出信息资料检索的传统范畴,甚至有可能发展成为直接参与人脑思维活动过程的“外脑”和紧密联系人们思维过程的桥梁和纽带。为此,《CNKI系列数据库产品标准》的制定必须以科学发展观为指导,面向现实,面向发展。在满足社会当前需求、需要的同时,为实现未来更为重要的时代目标奠定基础。在此原则下,《CNKI系列数据库产品标准》的制定和实施的目标,将实现产品的如下目标定位:

(1) 知识资源的集成化增值性整合传播媒体
  虽然网络传播的优势在于资源的高度集成,但实际上数字信息的非直观传播性、被动性和集成资源的信息无序,反过来又制约了集成化资源的传播价值。只有以深度开发、增值整合,实现知识信息的主动传播,才能使大型数据库的网络出版成为真正具有媒体意义的传播手段。为此,CNKI数据库将有充分利用超文本链接、知识挖掘等技术,将信息弥散而内容相关的资源整合为信息关联的“知识网络”,并引入智能排重、排序等技术,使无序的集成化信息资源成为有序的信息整合传播媒体。

  值得用户重视的是,作为传播媒体,相关产业利益制衡和市场经济体制,必然要求数据库产品的出版与使用严格遵守国际国内著作权法律法规。

  标准对更新数据连续出版的规范性、及时性、可靠性制定了技术与制度措施,对产品在机构用户内部网上的合法传播范围作出了明确的限制。

(2) 支持决策的权威信息检索工具
  
作为科技查新必查库和情报信息分析工具的基本作用是能够以权威的检索结果支持决策。实现检索工具权威性的充要条件是资源收录的高质量、完备性、时效性和检索系统的查全查准性能。因为只有标准化大型全文数据库才有可能在某个范畴内成为权威检索工具,本产品将在中国生产的文献资源范围内实现这一目标。此外还将出版各级各类学生的文献检索课实验教材。

(3) 学术文献与科研绩效评价工具
  
本产品除了能够给出权威的传统文献计量学评价指标之外,将通过引入知识元创新性比较分析、网络检索频度等新的定性、定量评价方法,产生更有参考价值的评价结果。

(4) 支持数字化学习、研究的学习与研究工具
  
数字化形态的文献资源可以嵌入“知识网络”型的数据库之中,透过数据库与其它网络资源的各种链接,处理成为一种互联网上基于动态“知识网络”的超文本智能文档,辅以阅读、诠注、标引、编辑、写作、讨论等各种学习与研究过程的数字化模拟,成为高效的学习工具和研究工具。

(5) 提供知识服务的智能化知识库
   知识资源开发的重要发展方向是成为用户发现问题、分析和解决问题的系统知识库。本产品中专业知识仓库将在专家的筛选、分类、编辑等工作基础上,采用智能知识挖掘手段和智能参考咨询技术,逐步达到知识库水平。

(6) 可二次开发的数字图书馆基础馆藏资源
  
数字图书馆建设的重要目标是通过进一步加工、整合资源,实现知识管理,为最终用户提供个性化知识服务。为此,本标准特别重视概念、数值、图片、图表等各种资源要素的加工质量和标引处理,以保证数字图书馆用户各种专门用途的需要。

4. 主要内容概述 产品标准部分从八个方面对产品作出了较为明确的规定。

(1)严格定义了全文数据库的基本属性。
  
明确规定了全文数据库的全文文本、全文索引与全文检索特性,制定了各类文档信息及其元数据的加工、存储、传输、显示、处理与二次开发利用的技术要求;定义了全文数据库连续出版的产品形态、应用模式与范围,规定了产品的现有应用环境以及对未来环境变化的兼容性。

(2)全面、系统、细化描述了产品内容标准。
  从资源收录出版的科学性、适用性、完备性、合法性、规范性、及时性等方面,阐述了产品作为知识传播工具的基本出版要求,明确了作为权威性检索工具、评价工具的内容条件,体现了作为学习工具与研究工具的内容规定了产品的不同内容版本,及其内容收录范围与文献层次和相应的文献收全率指标。

(3)明确制定了与国际接轨的产品结构。
  采用了目前国际、国内通行的资源描述、元数据结构、分类表、主题词等各类技术标准,并制定了各类数据库的元数据结构及其拓展规范,以及资源内容的分类组织、编辑、导航方案。

(4)强化了自主研发的CAJ浏览器功能。
   在支持PDF的同时,CAJ浏览器具备了更加强大的虚拟“知识网络”、知识挖掘与数字化学习研究功能。

(5)优化提高了数据库产品的整体性能。
   本标准在数据库建库与更新方案、全文索引与检索机制、词库整理与分词技术、选库方法与跨库检索技术、流量计费电子商务技术、镜像站点数据更新与软件升级服务、浏览器下载、检索日志管理等方面进行了全面系统的优化,大大提高了数据库产品的整体性能。

(6)产品质量标准明确规定了质量合格指标。
  在产品标准基础上制定的产品质量标准,对数据加工质量合格率、资源收全率、出版速度、查全查准率、系统响应速度等各项质量指标的合格范围与测定方法作了明确规定,为产品质量的有效控制奠定了基础。

(7)提出了产品质量保证制度与措施。(详见CNKI简报2004年第2期)

(8)提出了服务质量保证制度与措施。(详见CNKI简报2004年第2期)

5. 制定标准的过程、方法
  
本产品标准的制定关系重大、影响深远。为了保证《标准》的有效性、科学性和先进性,使其充分体现国内外各类用户的需求与信息化发展趋势, 《标准》的制定必须采取合理的步骤和科学的方法。

(1)充分听取、认真研究广大用户和专家的意见、建议,将用户需求与专家意见合理转换为产品设计和质量要求。

(2)书面公布《标准》征求意见稿,组织专家、用户研究、修订。

(3)公布《标准》的产品测试版,组织专家和用户测试,修订《标准》。

(4)正式发布产品。

(5)根据用户和专家意见继续修订《标准》。

注:《CNKI系列数据库产品标准》见“中国知网”首页“标准研讨会”频道。