清华同方主题词、分类号智能检索系统(医学专业)(MCI)

清华同方光盘股份有限公司MCI项目部 沈小建 许景红

三、 研制成果
  通过分析用户对网络数据库系统中主题词检索的需求、主题词检索目前存在的问题以及相应的数据标引制作的问题,我们认为开发一种既方便标引又能把检索者用自然语言表达的情报提问迅速转换成查找特定主题及相关资料的检索标识的工具,是很有必要的而且也是数字图书馆发展的需求和信息化发展的需求。目前我公司自主研制的清华同方主题词、分类号智能检索系统(医学专业)(简称MCI)便是这样一个高度智能化的医学信息检索系统,支持标引、查询、检索、浏览、组织信息的全过程。

1.系统特征

1.1 文献标引实现规范、标准和统一
  标引文献主题词采用的是依据中文医学主题词表及中国中医药学主题词表进行扩展整合细分的CHKD主题词使用表(副主题词等同主题词进行文献标引)。
标引文献分类号采用的是依据《中国图书馆分类法?医学专业分类表》进行扩展细分的CHKD分类使用表。
  标引或检索时对聚类文献主题概念或学科属性采用统一标准主题词或分类号表达,非规范的自由词转换为规范的主题词或分类号,副主题词等同主题词对文献进行标引和检索,符合叙词法的原理和概念组配方法,更符合网络检索的需要,为通过异构跨库无障碍的信息资源获取总库平台实现文献信息资源无界共享奠定基础。

1.2自动转换
  关键词—主题词—分类号可实现自动转换,支持非规范语言、自然语言向规范语言、受控语言自动转换。

1.3树形结构
  以主题词树形结构形式实现检索范畴的扩展及限定从而实现知识网络链接,可为用户提供一个进行系统性学习和研究的平台,既可以宏观了解某一领域的研究内容、研究范围和进展还可以微观知晓某一专题的属性、现状和发展趋势,并且用户还可以从概念及相关因素的延伸比较上挖掘出隐含的、有效的、具有价值的、尚未发现的的深层次知识来实现知识挖掘和知识发现。

1.4简便实用
  本检索系统界面友好、简便易操作。用户可任意选择检索方式,系统可根据用户需要,随时显示语义结构、词间关系,指导用户扩展或限定检索范畴,实现检索结果理想化。既可满足普通检索者的一般检索需求,又可满足专业图书情报检索人员的专业需求。

2.系统功能

2.1专项检索
  检索者选择主题词或分类号检索项,直接输入主题词或分类号进行检索。

2.2 智能检索
  选择主题词或分类号检索项时,系统可将检索者输入的任一关键词自动转换为该词所对应的主题词或分类号进行检索,实现主题词或分类号检索结果的输出,而检索者不需要知晓该关键词所对应的主题词和分类号的具体词名和类号;如果本系统无可对应的主题词或分类号,系统可自动按照所输入关键词进行检索。

2.3模糊查询
  选择主题词检索项时,可以在模糊查询框内输入所需使用主题词中含有的任一字或词进行主题词轮排查找,在查找到的主题词中点击所需的主题词便可直接进行检索;
  选择分类号检索项时,可以在模糊查询框内输入任一使用分类号进行分类号轮排查找,在查找到的分类号中点击所需分类号便可直接进行检索。

2.4主题词树形结构界面提供自选及限定检索范畴
  本位词检索 指仅含该主题词而不包括其下位词的检索;
  下位词检索 指可选择该主题词下位词的任意一个或数个词进行限定检索;
  主题词检索 指包括该主题词及其全部下位词的检索,即该主题词本位词和下位词之和的检索;
  上位词检索 指通过主题词树形结构界面所提供的上位词检索功能,选择需要的上位词或同位词进行检索。

四、 研制意义

  综上所述,MCI智能系统成功实现对CHKD期刊全文数据库进行规范、标准、统一的主题和分类自动标引;MCI智能检索系统不仅保留了主题词检索已有的优越性,而且还利于分类和主题相互结合、相互兼容、相互扬长避短;其智能化不仅满足了图书情报人员的专业需求,而且也方便普通用户掌握主题词、分类号这两种受控语言的检索技巧,极大地推动了信息时代知识共享的发展;主题词树形结构实现了知识网络链接,利于研究事物之间的关联及延伸,从而挖掘隐性知识实现知识创新;其成功地应用于CHKD期刊全文库,使CHKD期刊全文数据库实现了受控语言的标引和检索,对于发展全文数据库检索系统的受控检索技术具有重要的理论意义和实际价值,并且将大大提高CHKD期刊全文数据库的查准率和查全率,使CHKD期刊全文数据库检索系统达到国际领先水平。


                        沈小建:原北京酒仙桥医院图书馆馆长
                        许景红:医学硕士、产品经理


                                         上一页