“中国知网”将重资建设千万/十万级个人与机构数字图书馆服务平台
同方知网常务副总经理、总工程师 张振海 研究员

  一、资源集中和深度整合与个性化服务是数字图书馆的发展趋势

  随着数字图书馆建设的不断深入和拓展,数字资源的管理与利用也遇到了前所未有的挑战。一方面,数字资源数量、种类越来越多;另一方面,资源管理系统却更加分散,不同资源系统之间相互不兼容、不能互操作。这种状况使各个资源系统成为资源孤岛,统一检索困难,用户查全查准率降低。另外,各系统使用方式不同,并且系统之间存在内容重复,增加了读者使用与选择资源的难度,系统管理的复杂度与用户使用成本也大幅度提高。与此同时,随着读者信息素养的不断提高,读者对精、准、及时主动的个性化知识服务的需要越来越迫切,在目前这种状况下,个性化服务需求也难以满足。在复杂多样、混合使用和层次不一的资源系统中,图书馆难以开展有效的独具特色的增值服务。

  高度集成和深度整合的统一的数字图书馆平台是解决目前困境的有效办法。首先,它可以简化资源管理,节约管理成本;第二,统一的用户接口,使用方便简单,同时也减少了一些不必要的培训与服务;第三,扩大了资源的使用范围,提高了资源的利用效率,有效增强了图书馆的服务能力;第四,有利于开展独具特色的个性化增值服务,提升图书馆服务的整体水平。

  解决用户在科研、教学、决策等工作中出现的问题,开展个性化知识服务是数字图书馆未来发展的目标定位。实现这一目标的途径就是知识资源深度集成整合、并提供有效的和有价值的个性化增值服务的新一代数字图书馆平台。

  二、“中国知网”资源集成整合模式

  1. 数字出版超市

  在数字出版超市中,不同载体、语种、出版形式的数字资源,面向不同的读者,按内容进行分类细化和个性化整合。不同出版商的出版物均可在数字超市中实现数字出版,实现内容出版与最终读者的直接对接,图书馆与读者可以直接在超市中选择自己需要的内容。

  数字出版超市配置了功能强大的统一检索平台,检索结果可进行多维度的分组、排序,方便读者进一步筛选内容;另外,平台还提供了数字化学习、数字化研究、网络投稿等数十种增值服务和应用工具,全方位帮助读者进行探究式学习和创新性研究。

  2.总库总索引

  对于二次文献与第三方资源,可以采用总索引的整合模式,实现同一平台的资源管理与利用。用户进行资源检索、资源管理均在同一平台上。在用户最后需获取原文时,系统自动链接到第三方系统上。系统使用对用户是透明的。

  3.检索整合

  如果由于条件的限制,无法进行前两种资源系统整合时,平台也支持利用技术手段,将各个系统的检索整合到一起,实现统一检索。通过检索整合,可以实现本地资源与互联网资源的整合。

  以上三种整合形式,在整合深度与整合能力上,依次递减。在超市总库模式中,因为有全文,可以基于内容层次进行深度整合与检索利用,建设知网节。这样不但可以利用检索系统的高级功能,还可以利用浏览器的学习研究功能。在总索引模式中,因为有二次文献,可以提供高效的统一检索,统一排重,但无法做到全文一级内容层次上的整合与全文检索,整合效果稍差,但比检索整合模式好。在总索引模式中,“知网节”的内容没有总库模式完整。单纯的检索整合模式只能做到简单的统一检索,无法做到精确的去重,无法有效地建立知网节,整合层次最低。

  三、“中国知网”数字图书馆服务平台的服务模式

  在“中国知网”数字出版超市基础上建立的数字图书馆服务平台,分别提供针对机构与个人的个性化服务,即机构数字图书馆与个人数字图书馆。

  1. 机构数字图书馆

  机构馆可以按需选配数字超市出版的各类资源,可将本单位所有个人馆选配的资源合并,筛选后作为机构馆资源,或添加到机构馆已配置的资源列表中。可将本单位自有数据库资源发布到机构馆中,实现机构馆内单位自有资源的跨库、单库检索,与机构馆联通的个人馆可以选配机构馆内的单位自有资源库。

  机构馆选配资源后,可以在网上自动生成订单,通过电子商务平台进行直接网络支付。机构馆可以对本单位订单进行统一管理,对资源使用情况进行实时查询。

  可对本单位个人馆进行管理。机构馆可以按IP范围、工作证号等各种自动方式进行审批,也可以人工审批。对于本单位部分经常需要变动工作环境的个人馆,可以申请获得漫游服务。

  机构馆提供三种运行模式:

  镜像模式:机构馆及数据安装、运行在单位本地的计算机系统上。

  托管模式:机构馆运行在“中国知网”的网站系统上,机构选购的数据资源托管给“中国知网”。

  镜像+托管模式:正常情况下,机构馆按托管模式运行,用户需要时,可将数据拷贝回去,按镜像模式运行。

  2.个人数字图书馆

  个人读者可以直接免费使用本单位机构馆的资源,或者通过个人馆免费使用本单位机构馆购买的所有资源。

  在个人馆中,读者可按学科专业建设学科文献馆;根据自己的需要建设主题文献馆,主题文献馆可以实现内容每天自动推送。通过桌面版个人馆软件,将个人馆中最新内容自动更新到个人计算机中,并与读者本地计算机内的文献统一整理建库,实现个人馆资源与本地资源的跨库统一检索。

  同时,读者还可随时进行个人学术影响力评测;及时联系自己的学术社区;跟踪有关的科研项目;了解最新学术趋势、学术动态,发现新的研究动向。

  四、建设目标

  同方知网计划投资4-5个亿,建设数字图书馆服务平台。主要工作包括:

  1.大规模建设数字出版超市

  合作出版100个高水平的外文学术文献数据库。这些数据库将与中文数据库进行跨语言检索、双向中外文引文自动链接,构建统一的跨语言知识网络和知网节。

  建设中国海外文献数据总库,收集、出版国际上研究中国的所有文献,以及中国学者在国际上发表的各类文献资源,并与现有资源进行内容整合和链接。

  另外,与有关方面合作出版与学习、研究有关的其他国内数字资源,例如:学术图书、学者专著、教辅教案、古藉等。

  2.扩大平台的服务能力与服务保障水平

  投资软硬件开发,使得平台能够支持每年新创建机构馆数超过5万个,新创建个人馆数达到200万个。到2014年,建设机构馆总数超过20万个,个人馆总数超过1000万个,实时在线个人读者数超过150万 的服务规模。

  建立全球网站运行服务中心,全年365×24小时提供数据保障和系统运行保障服务。

  同时, 建立相应的网站灾备保障体系, 在物理上实现数据、 软件系统的冗余。

  将在北京建设超大型中心网站,在世界各地等建10个镜像网站。每个镜像站点之间通过互联网以及光缆专线相联。计划投入服务器3000套,租用带宽20G,可同时满足全球150万人在线访问和全文下载。

  整个网站系统通过全球统一域名管理系统和帐号认证登录系统实现对统一域名访问和用户单点身份认证,配置多级全球负载平衡系统,将来自不同地区的用户进行自动分发,保证用户进入最快速的网站。

  系统按功能划分为多个服务器集群,包括主页服务器群、安全认证服务器群、帐号服务器群、个人馆/机构馆个性化服务器群、检索服务器群、下载服务器群、数据存贮中心、数据更新服务器群、以及服务监控系统。各服务器群内部实现负载均衡,服务器之间通过高速局域网连接,配置万兆交换机实现网络分段路由交换和监控。内、外网之间通过高性能防火墙服务器进行隔离。