基于知识网络与知识服务网络的数字图书馆模型
--CNKI数字图书馆
清华同方CNKI数字图书馆设计工作组

  图书馆一直是保存和传递人类智慧的宝库。自1807年德国M.施雷廷格提出"图书馆学"概念起,一代代图书馆学家一直在孜孜不倦地探讨怎样才能使图书馆真正成为社会的知识与信息服务中心。一位法国国家图书馆馆长曾经著文说,要是有一座图书馆能够宣布它拥有世界上所有的图书那可真是太幸福了。在那个年代,这样的想法只能是一个"乌托邦"式的幻想。
    互联网的出现神话般地改变了人类的生活。就像得到了阿拉丁灯神的相助,我们已经在不断地看到,许多难以想象的事情都变成了现实。
    信息资源共享在很多国家动用了政府、企业、图书馆等各方面的力量搞了多年,至今还远不能及。因为它涉及著作权和出版业的利益及其产业发展方向,依赖信息技术各个领域的进展、信息基础设施建设水平、社会信息化程度与经济发展水平,制约于人们的阅读习惯、信息服务业的市场经济规则等等复杂而困难的问题。如果没有一个能够综合解决有关技术、市场、社会、文化、法律等问题的全面解决方案,实现这样的梦想是不可能的。
    CNKI工程在中国特色的社会主义市场经济体制下已运行7年,成功地集成了我国5400多种期刊、大多数博硕士培养单位的学位论文、500多种重要报纸的文选以及近年来的重要会议论文等大量文献资料,并实现了信息的连续更新;最近,清华同方图书数字化建设工程又将大规模启动。
    CNKI数字图书馆(CNKI-DL)的诞生,使"馆长的梦想"很有可能率先在中国区域性实现!

一、 CNKI-DL设计思想
    CNKI工程的设计者将数字图书馆(DL)视为服务于全社会的现代知识基础设施的一个基本的、核心的组成部分。它的作用是通过其对社会知识生产、传播、扩散过程的信息化服务,实现全社会公共知识信息资源的高度共享,支持各类机构内部的知识管理,为各机构创造学习和知识创新环境、提高知识创新的竞争能力服务。
    为此,CNKI-DL提出了基于知识网络和知识服务网络的基本设计理念。为的是找到一个科学合理的DL资源的组织、建构、服务、应用模式,最大限度地满足人们获取知识与信息的需要,最大限度地满足资源提供者传播知识信息的经济与文化需要。因为,如果DL能够将大量人群的学习、工作过程吸引到网上来的的话,各类出版、发行商必然将它视为其网络出版的最经济的市场与商业运行平台。

二、 CNKI-DL总体架构
    CNKI-DL试图用知识网络互联和知识服务网络互联的方式,利用统一的管理、检索服务平台和知识内容的链接,将两大部分信息资源--CNKI工程的自建数字化资源和世界上其它网上公共信息资源以及印刷版馆藏资源,通过"CNKI知识服务平台"虚拟为一个大统一的网络DL,由所有信息资源提供者组成的知识服务网络为读者服务。
    CNKI-DL的所有信息资源都通过"CNKI知识服务平台"上的知识元数据库和引文链接等内容关联链接成互通的知识网络,用户可以将所有关联进来的信息资源视为同一个数据库来使用。它还将图书馆的馆藏题录摘要数据库与所有其它数据库进行知识网络关联,实现基于原文传送技术的全球化馆际互借。所有加入CNKI知识服务网络平台的资源提供者将基于电子商务平台,自动按各自的规则计价计费,著作权使用费将按资源提供者与著作权人的事先约定在网上直接支付。可见,对中国大陆用户来说,CNKI-DL是一个查找知识信息资源的超级门户网站。进入这个门户,就可以用同一种检索平台检索所有数据库。对期刊、图书等出版者来说,CNKI-DL是一个拥有大量读者、信息即发即至的网络出版平台。

三、 CNKI-DL自建资源
1、著作权与资源收录范围
    CNKI-DL自建资源内容全面覆盖自然科学与工程技术、人文和社会科学各个学科领域。它的收录范围不限于出版物,按信息出版类型与著作权使用授权方式分为:
    著作权人同意上网的出版信息。如在期刊、报纸、图书、专利公告等出版物上,或通过电视、电台、公众演出发表的公共信息。可以通过某种授权规则取得著作权使用的授权。
    某个组织的内部信息。如企业网站上公开发布的信息、企业内部技术资料、管理制度、会议记录、财务信息、市场信息、工作经验等,是否公开、何时公开、公开范围等均取决于该组织的意愿。这种由知识管理生成的内部信息资源的利用价值很大。
    个人有权公开的信息。可随时在交流过程中公开的信息,创新价值很大。是否可以被CNKI-DL收录取决于个人意愿。如BBS、谈话、讨论等。
2、知识库的信息组织规则
    CNKI-DL的资源建设不是简单地把信息资源数字化,在选材时注重对过去的知识进行科学审慎的整理。
    首先,以帮助人们学习,特别是帮助人们学习知识创新的思想和方法为主要设计目标,CNKI-DL在内容构架方法上,以"建构主义"思想为指导,采取遵循各学科知识发现、发展的脉络,体现知识创新轨迹的方法进行数据库内容框架建设。在素材资源选取上,CNKI-DL采用原创性、综合建构性、教学性三者相结合的原则,力求对学习者以创新意识、思想和方法的启发。
    其次,取精华,去糟粕,避免将错误的、没有历史价值的、低级趣味的东西混杂其中,使学习者困惑。为此,CNKI-DL的建设将组织各学科专家对数据库内容结构进行精心设计,并对原生信息进行精选。
3、知识库的类型
    CNKI-DL按照应用的需要和对知识信息的加工深度,将知识信息资源库在内容上分成三个层次,即源数据库、专业知识仓库、知识元库。
    ☆源数据库按信息来源类型分类建库,如期刊、图书、博硕士论文等,以收录完备、更新及时、易于挖掘、存储与传输成本低等主要特性为建设标准。CNKI-DL的自建源数据库为:中国期刊全文数据库(CJFD)、中国图书全文数据库、中国优秀博硕士学位论文全文数据库(CDMD)、中国重要报纸全文数据库(CCND)、中国专利全文数据库(CPFD)、中国图书馆馆藏题录摘要数据库(CBLD)等。
    ☆专业知识仓库为专业机构用户群提供个性化服务,内容收录范围与资源采集标准按特定机构用户群的知识需求结构制定,如医院知识仓库,服务于从事医务工作、医学研究和医疗管理的医院用户群。CNKI-DL的自建知识仓库为:中国医院知识仓库(CHKD)、中国企业知识仓库(CEKD)、中国中小学数字图书馆、中国城市规划知识仓库(CCPD)、中国基础教育知识仓库(CFED)等。
    ☆知识元库是对知识点的元素化加工和概括提炼,满足人们快速了解各学科知识基本内容的需求和发现知识之间内容关联的需要。知识元是对一个知识的完全描述。知识元库是一个由知识元构成的海量知识信息资源,并通过知识元链接等方式与其他各种各类知识资源数据库相互关联形成的知识网络。是各种培训,教学,研究活动高效率实现学习目的的基础资源和必备"原材料"。
    这种分层架构的方法,使得CNKI-DL能够在提供面向机构和个人的个性化服务的基础上,帮助人们在获取知识的同时由浅入深地进行学习,从而提供一个利用CNKI-DL平台进行系统学习的工具和手段。
4、知识链接
    CNKI-DL基于对最新的信息技术的掌握,采用遵循知识发现、发展的认识逻辑和人类文明历史过程,开创性地通过引文链接和知识元链接从知识信息内容上将知识关联起来。
    引文链接是利用文献之间的引证关系来建立知识信息间的关联关系,将文献用引文链接起来,不仅可以找到知识之间的联系,而且可以找到知识发现的方法。
    知识元链接则是通过知识间描述和被描述的关系将不同的知识信息依据知识元素关联成为一体。
    这种信息组织构架方法所给出的是知识之间必然存在的关系,比传统的关键词、主题词对文献的描述更为具体、准确、全面、深刻。同时不受传统分类体系的限制,具有无限的可扩展性。CNKI-DL正在逐步将国内外的各种数据库链接起来,使知识网络的外延扩展到世界范围。只要用户需要知识,就可以从链接中找到;只要数据库是内容链接的,用户就可以从中摄取所需要的全部知识信息。显然,这种由知识链接所组成的是一个集大成?quot;知识网络"--这应当是数字图书馆建设的真正意义之所在。
    除此之外,CNKI数字图书馆还支持虚拟远程链接来实现数据库之间的内容链接以及数据库和馆藏目录之间的链接。

四、 CNKI知识服务平台及知识服务网络
1、 CNKI知识服务平台
    CNKI-DL的信息资源无论放在何处、无论是谁的、什么结构、什么软件、什么语言,只要在INTERNET上授权使用,均可由统一的CNKI知识服务平台进行管理使用。该平台由知识元库和DL管理系统构成。知识元库是内容链接平台,它将所有数据库用知识元自动链接为知识网络。DL管理系统包括:
    ☆分布异构统一检索平台
    该平台将CNKI-DL中不同厂家提供软、硬件环境不同、结构不同、使用方式各不相同的数字资源,用一个无须厂家公开数据库接口的智能化方法统一管理起来,用一种检索平台提供服务,消除了数据库之间的壁垒。
    ☆原文远程传送服务平台
    该系统将全文数据库中没有的文献,从世界各地图书馆按用户的请求Email给用户。
    ☆联库服务电子商务管理平台
    该平台可以按既定价格体系、交易规则和结算方式在网上进行交易。
2、 知识服务网络
    知识服务网络是在同一服务平台上,以服务规则和规范进行信息与知识服务的数据库服务提供商、图书馆等单位构成的服务群体。每个成员将他的数据库放在 "CNKI知识服务平台"上向用户提供信息与知识服务。

五、 结语
    CNKI-DL模型曾经在2002年5月于"全国高校数字图书馆知识服务网络研讨会"上进行过热烈的研讨,获得了到会500多名专家和图书馆代表的认可。目前,CNKI-DL建设已正式启动。CNKI数据库引文链接工程已全面展开,《中国学术期刊全文数据库》从2001年10月开始在网上逐步实现引文链接,今年底将完成中文期刊引文链接的80%。2003年6月将完成博硕士论文与期刊的引文链接,并初步实现期刊、博硕士论文英文引文与国内图书馆英文期刊目录的链接。知识元库模型改造将于2003年1月开始大规模建设。《中国图书全文数据库》、《中国专利全文数据库》将在今年底正式启动。此外,与国外数据库服务商的合作正在积极推动。