【摘 要】
:
随着Internet上信息量的飞速膨胀,使得人们在网上查找自己需要的信息变得越来越困难。虽然一些搜索引擎(如Google、百度)为人们从海量的网页中迅速查找有效信息提供了工具,但
论文部分内容阅读
随着Internet上信息量的飞速膨胀,使得人们在网上查找自己需要的信息变得越来越困难。虽然一些搜索引擎(如Google、百度)为人们从海量的网页中迅速查找有效信息提供了工具,但是现有的搜索引擎使用的信息检索技术大部分都是基于关键词匹配,这样使得搜索结果存在大量冗余和无用的信息,影响了返回结果的准确率。本文讨论的问答系统试图改变这个情况,它不仅能有效利用Internet这个庞大的信息资源库,而且利用本体(ontology)知识,使得返回结果更加丰富和精确。从目前国内外研究情况看来,问答系统质量很难令人满意,原因在于两方面:其一,问答系统问题分类不精确导致最终答案与问题主题偏离;其二,现有的候选答案抽取技术大多基于统计的方法,忽略了句子的语义,影响了答案的准确率。针对这些不足,本文从问题分类和候选答案抽取两个方面进行研究,首先提出了一种基于领域本体的中文问题分类方法,从而更加准确地定位了问题分类,使得答案抽取有据可循;其次,本文提出的基于本体的多策略答案抽取算法,将本体语义信息引入到答案抽取算法中,从而提高了生成答案的质量。本文的主要研究成果可以归纳为:1)提出了一种基于领域本体的中文问题分类方法,利用领域本体的层次分类信息同时结合同义词林对中文问题进行分类。适应了汉语表达方式的多样性和复杂性。2)提出了一种基于本体的多策略答案抽取算法,利用同义词林丰富候选答案的语义,改进了本体概念相似度的计算方法,并将其与模式匹配结合在一起。一定程度上提高了答案抽取的获取率和准确率。3)实现了一套原型系统,进行了对比实验,初步验证了本文算法的有效性。
其他文献
可控串联电容补偿(TCSC)由于其连续控制性可以在很多方面改善电力系统的性能,因此在电力系统中的应用潜力很大。但是由于其容性的特殊性及内部结构的复杂性,含串补的线路必然对传统的继电保护产生很大的影响。因此有必要深入研究TCSC对现有继电保护的影响,考察现有继电保护系统在TCSC线路上的适应性。本文从分析TCSC的内部结构及其工作原理入手,进一步分析了串补电容对输电线路中的电气量包括电压、电流,以及
随着全球能源告急以及环境污染加剧,以太阳能和风能等清洁能源为主的分布式发电受到人们的广泛关注。微电网将不同的分布式发电单元整合在一起,为本地负荷提供高质量的供电电
随着温室气体近年来不断地排放,全球气候逐渐变暖,CO2减排就成为我们亟需解决的问题。风能是一种重要的清洁能源,也是目前最受世界各国重视的清洁能源。风电作为清洁能源的引
电源是等离子切割的动力来源,电源变换技术是现代等离子切割设备中的核心技术之一,研究高效高可靠性的等离子切割电源对于提高切割效率和质量具有重要意义。本文设计了一种以两相并联带无源低损缓冲电路的Buck变换器为主电路的等离子切割电源,尤其对无源低损缓冲电路的参数设计作了细致、深入的研究。在分析无源低损缓冲电路的基础上,还对一种适用于大功率场合的耦合电感式无源无损缓冲电路进行了研究。详细分析了该缓冲电路
视频人体检测是人体行为识别,姿态处理等关键技术的基础,它担负着确认视频中是否存在人体目标以及人体目标精确位置的使命。针对视频人体检测问题,本文主要完成两方面的工作:
接地装置的冲击接地电阻测量是保证电力系统稳定运行和电气设备安全的一项重要工作。由于直接测量受到诸多条件的限制,因此目前对于冲击接地电阻的研究主要局限于数值计算和理论分析,对其测量只能是粗略的估算。本文在研究和分析接地装置数学模型的基础上,在不考虑冲击电流对地放电的情况下,将接地装置等效成由电阻、电感组成的线性时不变的分布式网络,在此条件下,接地装置的网络函数是唯一的。基于此,如果已知某一入射电流以
在能源危机和环境污染日益加剧的现实背景下,由分布式电源、能量变换装置、负荷、储能单元、监控和保护装置等组成的微电网日益受到世界各国的关注和研究。然而,微电网各个子