中文问答系统关键技术研究

被引量 : 0次 | 上传用户:ygp313
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
问答系统是融合了自然语言处理技术和信息检索技术于一身的新一代搜索引擎,其有着非常重要的应用前景,是自然语言处理领域和信息检索领域的一个重要分支,已吸引大量科学研究人员的兴趣。本文围绕问答系统实现过程中中文分词,问题分类,问题关键词抽取,候选答案集的构建等关键技术进行了一系列的研究与探讨,在以下方面做出了一些尝试性研究成果:(1)实验生成依存骨架规则库,并且利用条件随机场进行问题焦点词提取方法。问题分类模块结合了规则与统计两种方法的优点,对未知类别的问题依次进行疑问词-类别,疑问词+焦点词-类别和依存骨架规则库进行分类,对于不能用规则库解决的问题则通过贝叶斯模型进行确定。在小规模语料上取得了76%的分类准确率。实验结果说明疑问词-词性三元组规则的利用以及焦点词提取方法的改进对问题分类具有积极的效果。(2)在实验中利用条件随机场模型进行关键词提取的方法。通过利用条件随机场模型,在学习了已标注关键词的问题语料库基础上对测试问题集进行标注。在小规模的问题测试语料上取得了较高的正确率。(3)对计算候选句子分值的公式进行了修改。在候选句子排序中考虑了同义关键词位置相似度,通过计算用户问题和候选句子的同义关键词相似度、同义关键词位置相似度和句子长度相似度三个句子结构信息,从而对候选句子进行排序。实验结果表明这种计算方法对人物、地点、数字和时间等事实性问题类型效果较好。
其他文献
为给在大气CO2浓度升高条件下农作物栽培和农业可持续发展的科学管理决策提供依据,利用开顶式气室(OTC)研究了大气CO2浓度升高对春小麦辽春15生长发育过程中净光合速率、田间
2009年1月21日,由温家宝主持召开国务院常务会议审议并原则通过《关于深化医药卫生体制改革的意见》和《2009—2011年深化医药卫生体制改革实施方案》,拉开了新一轮医疗改革
<正>从小说题材上看,刘庆邦的名字是与农村、煤矿联系在一起的;从小说技法上看,刘庆邦的名字又是与鲁迅、沈从文联系在一起的。在刘庆邦笔下既有迷人的田园风物,也有善良的乡
为了解小麦S-腺苷甲硫氨酸合成酶(S-adenosylmethionine synthetase,SAMS)基因(SAMS)在抗旱节水中的功能,以小麦品种陕229为材料,以本实验室克隆的普通小麦SAMS基因的序列设
针对女人在父权制下主体地位的丧失以及女人系谱在父权制下缺席的现象,伊丽格瑞以批评弗洛伊德有关女性性欲的两种有限模式为发端,提出了“双唇”的意象来对女人性欲形态进行
人地关系矛盾突出已成为当前制约我国山地城市发展、影响山地生态环境的主要因素。受错综复杂的地理环境影响,山地城市建设呈现出一定的复杂性和特殊性,公共交通对土地的占用、
本文在解析人教版教材中“DNA的粗提与鉴定”的实验原理的基础上,从实验取材和关键步骤操作等方面,分析了实验成功的关键因素,并通过实践拟定出能在40 min内完成的实验操作步
科学性是公务员考试制度不断完善的方向,只有坚持把科学性原则放在首位,才能更好地实现“准确选人”的根本目标和体现“人尽其才,才尽其用”的根本价值取向,才能在操作层面体
随着数控技术的快速发展,数控机床在机械制造业中占据了主导地位,因此,社会对高素质、高技能的数控人才需求急剧增长。高等教育,尤其是职业教育,由于资金匮乏、设备少、学生
<正>中国密码学会2014年会(ChinaCrypt 2014)将于2014年8月27–30日在河南省郑州市召开.本届年会由中国密码学会主办,解放军信息工程大学承办.会议旨在汇聚国内密码领域专家
期刊