CNKI知识网络服务平台KNS3.0简介

  一、开发背景与目标
1999年6月中国期刊网开通以来,全国已有360多个中国学术 期刊文献检索咨询站由单机、局域网光盘升级为中国期刊网 镜像站点,预计今年将新增镜像站点500多个。设立镜像站点, 用户单位内部网上的所有计算机均可直接上网,检索与服务 方便,不受时间和上网通讯费及网络出口带宽限制,便于单位 内部图书情报部门保存数据库馆藏,集中管理内部网的服务 ,这些优点已经使镜像站点成为国内外大中型图书情报单位和 信息服务机构使用CNKI全文数据库的首选方式。
  随着CNKI工程的不断推进,CNKI的信息资源已逐步形成“源 数据库”和专业“知识仓库”两大类型。“源数据库”是指 期刊、报纸、博硕士论文、会议论文、专利、海外数据库等按 文献信息来源分类的数据库,“知识仓库”是指在“源数据 库”基础上,按照专业用户群的标准知识结构,从“源数据库 ”中挑选出来重新整合形成的数据库。“源数据库”因其文 献著录格式标准不同具有不同的数据结构,从而“知识仓库” 就必然是一个异构数据库。为了便于最终用户检索,便于镜 像站点更新、管理数据库,我们研制成功了可以检索、更新、 管理各类异构数据库的统一平台,称为“CNKI知识网络服务平 台”。为了保持技术性能指标的连续性,我们称其为“CNKI知 识网络服务平台3.0”,简称KNS3.0。
KNS3.0基于WIN2000和IE4.0、NETSCAPE4.0及以上版本开发,数据库结 构描述语言采用国际标准PDF数据结构,并可自动扩展为XML国 际标准结构。支持异构式数据库和多媒体数据库的检索与管理 。全文检索采用基于知识挖掘技术的智能算法,文献输出选 用PDF格式,多媒体输出支持各种国际标准。
  KNS3.0由检索服务系统、数据库管理系统、网站管理系统 三大部分组成。
  二、KNS3.0的结构
  (一)平台结构
  1、检索服务系统
  1)检索子系统:具有全文数据库、题录数据库、摘要数 据库、引文数据库、基金数据库五个大检索模块和在线翻译功 能。在每个数据库中提供初级检索和高级检索两个层次的检 索功能,满足不同类型用户的检索需要。
2)资源输出子系统:具有题录、摘要、全文原版、多媒 体输出四个标准输出模块。提供按与检索主题的相关程度或数 字资源的更新日期对检索结果进行排序显示。支持检索结果 的选择处理和成批输出。
  3)编辑处理子系统:具有文字切割、图象切割、在线图 文混排编辑三大模块。对检索到全息数字资源下载后进行各种 编辑处理,建立本单位或个人的创新知识资源库。
  2、数据库管理系统
  1)CNKI数据库更新、追加子系统:提供各种CNKI“源数据 库”和“知识仓库”的日更新、月更新功能。镜像站点选择通 过互联网、同方卫星网以及CNKI数据库交换服务中心进行日更 新,使用各种数据光盘进行月更新。
  2)其他数据库更新、追加子系统:支持将用户自建和购 置的符合CNKI知识仓库标准的其他数据库资源进行定期或不定 期的更新、追加或发布。
  3、网站管理系统
  1)帐号管理子系统:建立、删除、停用、恢复用户帐号 ;设定登录数、并发数和IP范围;授权使用知识仓库种类和使 用时间;查看所有连接到数据库的用户列表。对用户授予不同 的检索权限,形成严格的用户分级访问管理体系。
  2)数据库检索统计分析子系统:实现对用户的所有信息 的查询,提供检索次数排行榜。随时查询任一用户的信息,包 括该用户对数据库的任何操作、在线情况和累计情况。为图 书馆选择订购数据库,有针对地开展信息咨询服务提供定量、 客观的参考依据。
  3)支持数据库的远程管理。KNS系统管理员可以使用任意 一台计算机对KNS进行远程管理,镜像站点管理更加灵活、方便 。  三、功能特点
  1、支持异构数据库统一检索。支持各种CNKI“源数据库” 和“知识仓库”的检索;提供开放式数据库追加接口,用户 单位可将自建或购进的其他“知识仓库”追加到KNS3.0中。
  2、支持多媒体数据库的检索和完美再现。提供对各种排 版格式电子文档、数据库文件以及图片、音频和视频文件等多 媒体数据库和知识仓库的检索,不论使用CNKI知识仓库统一的 KD格式,还是采用各种数字化文件的原格式,都能实现各种数 字化资源的完美再现。
  3、支持数据库跨专辑、跨年度检索。用户可以在期刊、 报纸、论文、专利等全文数据库中任选一个或几个专辑,对其 某一年或任意年度段的文献进行跨专辑、跨年度检索。
  4、初级检索和高级检索功能相结合。初级检索面向一般 读者,在原专项检索的基础上增加了中文刊名检索、按出版年 度检索和按出版时间检索的功能。高级检索面向专业人员, 可以对多个检索项目进行逻辑“与”或者“或”任意搭配的组 合检索。
  5、增强信息咨询服务功能。对各种检索的检索结果进行 按相关度排序或按更新日期排序。增加了检索结果题录摘要、 原版全文的批处理存盘、打印功能,使得镜像站点的信息咨 询服务更加方便。
  6、预留引文链接入口和作者E_mail入口。与引文链接数据 库结合直接显示被引用文章的全文。给作者发送E_mail,进行在 线学术交流讨论。
  7、检索性能大幅度提高。采用并行处理技术,系统吞吐 量大。词平均检索速度达100GB/秒(测试环境Server:CPU/PIII800MHz ,RAM/512M,NOS:Windows2000server),是V1.0版检索速度的30倍,是目 前已知最快的中文检索软件的10倍。
  四、运行环境:
  软件环境:服务器端:中文WinNT4.0+IIS2.0+ServicePack3或 Win2000server及其更高版本;客户端:中文Window95/98/NT/2000+IE 4.0、NETSCAPE4.0及其以上版本。
  硬件环境:服务器配置:CPUPⅢ500Mhz以上,建议使用双CPU ,内存最低配置512M,建议1G以上或更高。客户端配置:满足运 行操作系统软件要求。