科技文献副主题词抽取及其在分面检索中的应用1)

来源 :情报学报 | 被引量 : 0次 | 上传用户:ygyyy2012
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文研究了科技文献副主题词的自动抽取问题,并对其在分面检索中的应用进行了探索。为实现副主题词的自动标引,本文提出了以标题作为抽取数据源、基于规则进行抽取的实现方法,并以图情领域文献进行了实验。结果显示,基于规则的抽取方法在召回率和准确率方面表现良好,均超过了90%;但仅以标题作为抽取数据源会导致召回率偏低,仅有49.9%的文献能抽取出副主题词。为探索副主题词在分面检索中的应用,本文以图情领域文献为例构建了原型系统,从使用效果来,副主题词作为独立的检索点价值不大,但和其他检索点配合使用则可以更贴切地表达用户需求,作为分面则能在帮助用户进行探索式检索以及结果筛选方面发挥重要作用。本研究的局限性包括仅采用标题作为副主题词抽取数据源,导致召回率不高;在副主题词抽取时未考虑同时抽取相应的主题词等。
其他文献
通过对I型游标万能角度尺各测量面的平面度、直尺和基尺测量面的平行度、直尺外角的垂直度、零位正确性等因素的分析,得出在检定中各项指标均必须保证在合格范围内才可以满足
A novel zinc coordination polymer, [Zn(bptc)(bpe)(HO)]n (1, Hbptc = 3,3,4,4-benzophenonetetracarboxylate, bpe=1,2-bis(4-pyridyl) ethane),has been prepared under
A new metal-organic coordination polymer,[Ce(L)(HO)]·2HO (1,HL=(E)-2,6-dimethyl-4-styrylpyfidine-3,5-dicer-boxylic acid),has been synthesized and characterized
Nitrifying biomass on ring-shaped carriers was modified to nitritating one in a relatively short period of time (37 days) by limiting the air supply,changing th
Methyl 3-(5-bromo-1-ethyl-1H-indole-3-carbonyl)aminopropionate has been syn-thesized by the acylation of 5-bromo-3-trichloroacetylindole with β-alanine methyl
Ozone has become one of the most important air pollution issues around the world.This article applied both O3/(NOy-NOx) and H2O2/HNO3 indicators to analyze the
科技报告制度建设需要借助现有网络化技术手段来构建规范化的科技报告集成管理平台。作者基于科技报告工作流程和标准,提出了科技报告集成管理系统的总体框架,即科技报告撰写、
科技报告资源开发利用对于科技发展和技术创新、放大国家财政投资效益,具有突出重要的意义。建立统一的国家科技报告开发利用体系应妥善处理好知识产权问题。结合科技报告开发
科技报告质量是科技报告特征和要素,是提升科技报告服务水平的重要指标。本文通过梳理国内外科技报告质量评价指标体系建设的理论和实践,结合中国科技报告工作进展和实践,提出了
本文利用监督学习的方法从社交网络的用户数据中分两个阶段挖掘最佳的社交关系强度分类模型,并进一步探讨不同用户数据对于社交关系强度的区分能力。研究发现,基于贝叶斯网络算