面向知识服务的数字图书馆技术方案
知识网络事业部产品经理 潘守东

  数字图书馆的建设目标是实现知识服务,面向知识服务的数字图书馆具有以下鲜明特征:即时服务、按需服务、精确服务、完备服务、个性化服务、主动服务、一站式服务 他使图书馆跨越了文献服务直接进入知识服务阶段。建设面向知识服务的数字图书馆对信息资源建设的层次、深度及广度,相关的IT、人工智能技术,实时交流通讯技术都提出了较高的要求与挑战。《中国知识资源总库》(简称《总库》)及系统平台,是基于知识网络和知识服务网的具有完备知识体系和规范知识管理功能的、由海量知识信息资源构成的学习和知识挖掘系统,是建设面向知识服务的数字图书馆的完整解决方案。

一 资源建设

  资源采用《中国知识资源总库》资源 + 因特网资源 + 自建资源+ 其他资源模式,通过异构统一检索平台实现统一访问,通过知识元库和知识网络实现知识资源融合与知识共享。
  《中国知识资源总库》采取“三层结构”组织资源。三个层次如下所示:
  基本信息库 基本信息库由各种源信息组成。如期刊、博硕士论文、图书、报纸、专利、标准、年鉴、图片、图像、音像制品、数据等。该库按知识分类体系和媒体分类体系建立。
  知识仓库 由专业用途界定知识仓库的知识范畴和层次,由学科知识体系确定知识模块、知识点及其内容。内容可以从基本信息库中选取。
  知识元库 由具有独立意义的知识元素构成。它包括理论与方法、事实、数值型三类基本知识元。既可独立使用,也可与基本信息库、知识仓库相关联使用。
  因特网资源:通过总库平台的 3I系统集成整合因特网资源。
  自建资源: 通过TPI系统进行特设资源的开发。
  其他资源引进:异构统一检索平台实现统一访问。
  《总库》产品形态主要有虚拟和镜像两种,前者细分为网络包库和知识卡两种,后者分为本地镜像和知识快车两种。

二 服务平台建设

1 资源更新服务网络

  《中国知识资源总库》现已建成的CNKI期刊数据库、学位论文等基本信息库和CNKI系列知识仓库日更新量高达1G,在《总库》3年规划中,CNKI数据量将增长为目前的10倍。因此用户端海量数据的更新和存储问题变得尤为重要。

 天网日更新式
卫星日更新所有数据 采用磁盘阵列存储数据库.
优点:方便快捷,不影响网络的正常使用。
缺点:需要安装卫星接收设备,一次性投入较大。
适用用户:没有INTRANET或INTRANET不健全的用户。
适用数据库:所有数据库的索引和全文。

 地网全文日更新式
每日从CNKI交换服务中心下载安装全文更新数据 采用磁盘阵列存储数据库。
优点:检索和全文都在本地,速度快。
缺点:需要硬件设备特别是存储设备的保障,对网络条件要求较高。
适用用户:地区、行业网络数字图书馆,与CERNET连接带宽0.3M以上的其它用户。
适用数据库:所有数据库的索引和全文,特别对于日更新量小的数据库,比如报纸全文数据库和会议论文全文数据库。

 地网索引日更新式
每日从CNKI交换服务中心下载安装全文索引更新数据,全文用光盘按光盘出版周期更新。最终用户在使用时,对于以前的数据可在本地下载全文,而对于日更新数据,需要到中心站点下载全文。采用磁盘阵列存储数据库。
优点:检索结果完全,对于网络条件要求不是很高。
缺点:最新的全文可能在本地查看不到,也需要硬件设备特别是存储设备的保障。
适用用户:地区、行业网络数字图书馆,与CERNET连接带宽0.1M以上的其它用户。
适用数据库:所有数据库的索引。

 赝镜像方式
用户保留镜像,保留需要的或者使用频率较高的数据(比如最近两年的全文),最终用户可以直接在中心网站检索,自动就近下载全文。采用磁盘阵列存储数据库。
优点:满足本地保留全文的要求,达到资源的最合理配置。
适用用户:网络条件好,要求保留数据但不愿意及时更新数据的用户。
适用数据库:所有数据库。

2.资源管理与服务平台

  在已有《总库》资源的基础之上,《总库》技术平台还提供了网络化、数字化的专业增值服务。
  科技查新 经查新项目委托、查新项目分析、查新范围确定、查新策略制定、相关文献资源分析、查新报告管理等流程,使用概念提取与分析、异构跨库检索、查新项目智能分析、网络联合查新等技术,为科研立项、成果鉴定、专利申请、产品与技术引进等提供新颖性判断。
  虚拟参考咨询 通过问题库、知识表示、自然语言检索等功能模块解决图书馆在网络化、数字化环境下向用户提供参考咨询服务的问题。
  定题服务 通过TPI知识挖掘、知识提取功能对资源进行个性化配置,通过个性化定制功能、异构跨库检索功能和智能分析模块为单位或者个人提供长期的个性化知识服务。
  专题服务 通过TPI知识挖掘、个性化定制功能、异构跨库检索功能、虚拟参考咨询和网上协作研究平台为单位或者个人提供短期的个性化知识服务。
  远程教育/教学平台 建设资源技术服务合一的系统。为教、学对象提供一站式全方位服务。资源总库为系统提供丰富的教学资源。系统提供先进的教、学手段:自学提升系统、协作学习系统、专题探索系统、情景教学系统、实时交流系统、评估测试系统、兴趣社区系统、智能答疑系统等。文字、声音、视频、动画、活动、游戏等多种教学方式融于其中。

三 资源深层合作开发

  《中国知识资源总库》源数据来源范围广泛,涉及文献类型多样,不同行业,不同单位需要针对个性化的知识信息需求建设特色资源库或者对《总库》进行深度开发和资源整合。利用资源数字化加工系统TPI,可以实现本单位特色电子资源和纸本资源的数字化,建立特色数据库,通过互联网实现资源共享。同时可以利用TPI建库系统对已有数据库进行个性化的深度加工和知识挖掘以建设各种专题知识资源库。还可以通过TPI建设全社会的共建共享工程,各个图书馆首先实现馆藏特色图书的数字化,通过建立区域性或者全国性的服务中心,把各个馆的特色图书集中起来,将其建设成为社会化的数字图书馆。或者图书馆开放本地服务器,向外提供服务,通过网络互联,建立一个虚拟的合作式数字图书馆。