基于多词表的自动标引技术研究——新华社新闻稿自动标引的实验

来源 :情报学报 | 被引量 : 0次 | 上传用户:yangwenhuai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
避开汉语分词中的技术特点,转向基于多词表自动标引抽词研究是当前中文信息自动主题与分类标引可以采取的一种策略,也是最为可行的方法.本文以新华社新闻稿中的题名和导语为对象,详细介绍了基于多词表自动标引技术中的词表构建、自动抽词、主题标引和自动分类等技术.并成功设计了新闻信息自动标引的实验系统,取得了较好的效果.
其他文献
本文根据湖南省竞争情报普及和示范工程的具体实践,聚焦企业层面的竞争情报工作,采用召开企业座谈会、文献资料研究、专题讨论相结合的方法,研究了实现竞争情报价值过程中存在的
1渭河流域水污染概况渭河是黄河最大的支流,渭河流域横贯陕西省中部的关中平原,沿河串珠式地排列了西安、咸阳、宝鸡、杨凌、渭南五座城市,加之著名丰富的文物、风景旅游名胜