CDMD新解
——谈改版后《中国优秀博硕士学位论文全文数据库》的特点

一、CDMD纳入法制化正式出版轨道
   清华大学2003年11月8日在人民大会堂举行的《中国优秀博硕士学位论文全文数据库》等九刊创刊仪式,标志着CDMD的正式创刊发行。本刊由新闻出版总署批准创办,教育部主管,清华大学主办,中国学术期刊(光盘版)电子杂志社编辑出版,清华同方光盘股份有限公司总发行。
  过去,博硕士学位论文大都没有正式出版发行。通过著作权人投稿,由CDMD正式出版论文,是保护研究生培养单位、导师和作者本人等有关著作权人研究成果和著作权的一种法定方式,也是解决论文稿件发表许可的合法途径。因为,按照现行法律,未经正式出版的作品,未经著作权人授权许可,网站不得使用,包括著作权集体管理组织,也无权授权任何人以任何形式出版。
  CDMD通过与各研究生培养单位协商签订协议,取得培养单位、导师和作者的著作权使用许可,并一次性支付稿酬,颁发收录发表证书,兼顾到了研究生培养单位、导师和作者的利益,妥善解决了学位论文的版权问题,获得了新闻出版总署批准的正式出版刊号,第一次实现了学位论文的出版,保证了数据库的合法性和长期稳定性。

二、论文精选规范化,出版数量稳定化
  CDMD是正式出版物,定位是出版内容具有一定创新性和较为重要的学位论文。因此必须对出版内容有所选择。在国内现有研究生学位论文质量管理尚缺乏统一规范的情况下,为了保证数据库的内容质量和学科体系完备性,本刊暂定限收有博士授予权的研究生培养单位的博士论文和优秀硕士论文,其中优秀硕士论文为各培养单位评选的系级以上优秀论文。经过2年的飞速发展,CDMD已经建设成为一个资源完备、体系完整、质量上乘的学位论文数据库。目前与CDMD签约合作出版的博士培养单位为285家,占全国博士研究生培养单位的92.5%,已经出版的2000~2003年论文10万本其论文学科体系基本完整,覆盖面较广,分布基本均衡,满足各类综合性高校、科研院所、医院、政府机关等各方面的需求。
  由于CDMD暂行如上稿件收录标准,必然会遗漏一些有创新价值的硕士论文。待各硕士培养单位建立规范的论文评优制度之后,CDMD将陆续增收较为重要和学术水平较高的硕士学位论文。
  2004、2005年,CDMD将每年收录出版论文6万本,其中博士论文4万本,硕士论文2万本。到2006年,CDMD学位论文总量将达到30万本,博士论文收全率超过90%,优秀硕士论文收全率超过50%。

三、检索学位论文不可囫囵吞枣
  学位论文的编写形式类似专著,其特点是,主题范围可大可小;论述系统、详尽,但略嫌冗长;新概念较多,但不可能详细解释;关键词相对创新部分较为准确,但却难以覆盖各章节内容;章节有法,但独创内容分布位置不一;引文著录细致,但缺乏规范。由于这些特点,如果将学位论文视为一篇文章来编辑处理,检索结果一律呈现论文全文,那么,由于检索元数据只能描述论文整体轮廓,不能细化检索,仅靠全文检索,就很难查全查准。而且论文较长,不便全部浏览、下载。

四、深度开发,实现知识单元直接检索
  为了满足细化的个性化需求,在保留整本检索功能的基础上,新版又提供了按章节检索、浏览下载的功能。根据《总库》检索功能规范,将论文的“篇章节”与期刊的“刊篇”进行“同构化”对应处理。论文题目既对应于篇名,又对应于刊名;论文章或节均等价于文献篇名;主要章节配备关键词;目录和参考文献与各章节对应。这样可使论文的章节作为论文的下位文献单元,成为可分的“独立文献”单元检索、浏览、下载。
  实现按章节检索,必须对论文进行彻底数字化加工,并拓展元数据结构,进行深度标引。新版按照《总库》的建设标准,全息提取论文原有元数据,如中英文篇名、中英文关键词、中英文摘要、目录、正文、作者、导师、学位年度、关键词、摘要、目录、参考文献等,另外,拓展标引了论文的下位元数据,如章节名、章节摘要、章节关键词和章节参考文献等。同时也基本上统一了《总库》内各种数据库的元数据结构,奠定了对《总库》基本信息库进行跨库检索的数据基础。另外,CDMD通过细化的知识分类和学科专业两套导航分类检索体系,支持导航下对章节的直接分类检索,以满足按知识特征和学科特征对学位论文进行利用的要求。

五、CDMD将成为一种新型学习工具
  多库统一检索 CDMD可以与多种基本信息库在全文、章节层次上统一检索。此外,CDMD相关检索项区别精确检索和模糊检索,以提高满足对于查全和查准的不同需求。
  引文与知识元链接检索 CDMD在参考文献彻底数字化的基础上,对参考文献进行规范化处理和筛选,有效分离每条参考文献的子元数据项。通过引用和被引用关系建立CDMD和《中国期刊全文数据库》、《中国图书全文数据库》、外文期刊题录数据库和图书馆书目数据库等知识资源的链接,建立《总库》模式的知识网络体系。
  学位论文既产生新知识元,又大量引用旧知识元,如观念、理念、思想、概念、公理、原理、定律、方法与技巧、科学与工程数据、社会与经济统计等。CDMD既可直接从论文中调用知识元内容,也可作为结点链接CDMD和其它各种知识资源,建立相关知识的知识链,形成资源的知识网络。
  原版显示与识别处理 CDMD提供高质量的原版显示的全文,并可根据需求的不同,提供具体的章节全文和整篇全文两种方式。对于原版显示的学位论文全文可以进行识别文字、复制图片和提取页面等相关操作。
  通过多库查询、知识链接检索等方式,每篇学位论文将可成为从事专题研究和专题学习的系统化知识资源体系,使CDMD成为一种特别方便的多功能学习工具。

六.如何提供CDMD资源与技术服务
  在“CNKI数字图书馆网络服务平台”上CDMD数据每日更新,用户可以获得最新的学位论文。它既向全球用户提供网上包库、计数收费等方式的直接信息服务,也可以为单位、行业建立的区域性、行业性镜像站点提供信息更新服务。
  用户可以通过清华同方光盘股份有限公司设在各省的办事处解决CDMD使用中的技术问题。

                                  (CDMD编辑部供稿)