为什么要建设《中国知识资源总库》

徐如镜 《中国知识资源总库》编委会副主任

  谈到建设《总库》,就是《中国知识资源总库》,大都觉得令人兴奋。然而也有人觉得茫然、疑惑,甚至感觉似有商业概念炒作之嫌。那么,它到底是什么呢?是一个科学的知识资源传播共享方案?一个无所不包的数据库?还是一个讲不明道不白的说法,抑或是一个科学幻想?无论积极的、消极的,还是反面的看法,都在观其行而度其意,对《总库》拭目以待。
  无论怎么讲,《总库》一定是对大量无序知识信息资源的一种集成整合。众所周知,人类已有的和不断产生的知识信息总体上看来是无序的,只有对它进行各种有序化的集成整合处理才能便于人们获取和利用。于是,世界各国、各行各业的各种信息产品制造商和信息服务商,包括数字图书馆,一直在开发各种各样的数据库,或者是开发智能化的搜索引擎,对无序资源进行有序化整合。目前林林总总的数据库至少有上万种,而且像雨后春笋,其数量还在以每年60%的速度成长。人们发现,大量整合努力的结果是把浩如烟海的知识信息资源又变成了一片无际的数据库森林,一个新的层次上的信息无序又出现了。
  人类的知识是在分化和综合的不断交替之中发展的。一方面人们需要越来越细化的专业知识信息,另一方面更需要跨学科、跨专业的多领域知识融合,二者对立统一,不可偏废。所以,愈加细化、专业的知识信息库和愈加综合、融通的通用数据库的出现,都是社会知识需求发展变化的必然结果。
  《总库》是不是就简单等于一个数据库的大汇总呢?譬如,有的数字图书馆或网站,把各种数据库像摆货架一样放在一起,让读者一一分别检索;一般搜索引擎网站只提供简单检索手段,读者看不到网上究竟有什么内容,也不知道这样的检索是否能查到应该找到的内容,而且这些似乎被假定读者没必要知道;新闻网站信息频道简单明了,但读者只能在这些频道里有什么看什么。这些简捷明快的知识汇总和分类导航方法,对知识信息处理的层次之浅,对获取信息的可靠程度之低,《总库》建设显然不能采纳。
  为什么这么说呢?因为知识作为人类对主客观世界的认识在本质上是相互关联,而且不断发展的,而且人们对知识的描述或者是描述知识的信息本身,也呈现出多样化的、复杂的相互联系和不断变化,也并非是孤立不变的。这就决定了人们必须利用这些联系和变化去查找、发现和获取知识信息。把知识信息按照数据库编制者的主观愿望割裂开来,或者不能反映知识信息资源内部客观存在的内在联系,都将在某种程度上给读者造成发现知识的障碍,甚至是误导,都将对人类认知能力的提高形成不应有的限制。方法简单固然有便于操作的好处,但是因为片面追求操作简单性,失去的将是大量有用的知识信息,甚至失去了信息检索本身的意义。

《总库》的要害就在“总”字。它的特殊意义有五条:
  第一、在数据库的操作层次上,将分布存储、不同软硬件平台、结构不同、语言文字不同的任何数据库的组配视为一个资源网格(或者是说一个总数据库),在一个统一平台上检索。对读者来说,各种数据库是一致有序的。比如统一导航,在一个导航栏目下,读者可以浏览所选所有数据库的同类内容;统一检索,用同一检索表达式可以检索所有数据库,并能随心所欲地分类浏览检索结果。不仅如此,人们可以针对不同检索目标,利用不同的知识信息特征(检索元数据)去构造、试验不同的检索表达式,以逐步逼近检索目标,逼近查全、查准。这样的操作方式其意义不仅在步骤的简化,更重要的是可以使读者保证检索思路的一致性和信息特征辨别的方便性,排除了在逐一检索的过程中可能出现的漏查、漏结果和重复,大大减少了严重影响查全查准的隐患,极大地提高了人们对信息检索逻辑的自觉控制水平。
  第二、一个能够反映知识关联和知识发展的知识门类导航体系。它既可满足人们越来越细化的专业知识需求,又能够科学地反映知识之间在学科专业层次上的关联和互动,从而满足了有效获取、综合利用知识信息的需要。
  第三、用知识元、引文、关键词(或主题词)、基金项目等各种链接方法自动建构了知识信息之间的微观联系,称之为知识网络。该知识网络所反映的知识信息之间的关联超出了语义关联的范畴,直接反映了文献之间在内容意义上的关系,因而它是一种最直接有效的文献查询途径,也是理解内容、发现内容的重要手段。根据《总库》的平台设计,知识网络具有操作系统性质的功能。一种数据库只要纳入《总库》平台,就可以通过知识网络与平台上所有其它数据库建立内容关联,进入读者的检索途径。这就意味着,《总库》并非各种数据库的“物理“相加,每一种数据库将在规范的管理平台下成为《总库》的一个有机组成部分,其价值得到了整体提升。
  第四、《总库》建设的目标不仅在于全面、系统地整合传播已有的知识资源,更重要的是为了及时引入最新的知识资源。《总库》这一名称看起来似乎失去了知识的专业化特点,失去了知识信息服务的针对性,但是,《总库》对所有资源的有序化整合,特别是以其最大限度满足人们获取知识信息需要的优势,将为知识资源的提供者或称为互联网出版者,创造一个潜力无穷的知识资源超市,从而成为互联网出版的主渠道,保证了《总库》资源的新颖性和完备性。只有这样,符合市场经济规律的产业机制,才有可能真正实现知识资源的有效运用。
  第五、《总库》是一个为全社会服务的知识基础设施。为什么总是这么讲呢?因为《总库》的作用不止于实现知识信息的传播共享,而且要利用这种传播共享实现真正意义上的数字化学习,包括网上科研、情报获取与分析、知识管理等等。也就是说,《总库》将直接服务于人们的学习、工作和生活过程。它将使人们越来越充分地享受到信息化带来的无穷妙趣,在根本上改变人们学习、工作和生活的方式,改变人们的理念,提升智力活动的价值。它将和交通、通讯、能源三大社会基础设施一样,为人类的文明进步起到不可或缺的支撑性作用。
  综上所述,《总库》之“总”的意义,并不在于如何从字面上去理解,而重在于它是否具有独特的、具体的重要科学文化价值和社会意义;也不在于“总”字是否靠产业化运行实现,还是所谓商业炒作,而在于它是否反映了社会发展的需求和文明进步的必然。其实可能恰恰相反,如果说这样的知识基础设施是一种必然,那么,实现它的重要途径可能就是基于互联网出版等先进科技手段的文化产业的大力发展。这一点,我国和世界许多国家的文化产业当代发展史已经给出被无可辩驳的证实。只要坚持改革开放、与时俱进、以人为本、科学发展、全面建设小康社会的基本路线,只要坚持以法治国,发展文化产业,带动经济和社会发展的方针政策,只要取得建设知识基础设施的社会共识,《中国知识资源总库》这一似乎理想化的目标,将一定会在业界和社会各界的共同努力下成为现实。

                  (徐如镜:著名情报学家,第七、八、九届全国政协委员)