基于机器阅读理解金融领域问答系统

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:mqs129977
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
如今时代,合理运用数据,精准高效捕获信息是当今信息技术的研究热点。由于数据规模大结构复杂,传统的检索问答无法满足当代的需求,问答系统简洁、快速、准确获取解答,吸引了众多目光,电商、医疗、教育等行业相继展开研发。金融领域问答系统从银行客户解答到网上投资借贷问答逐步发展,金融领域问答系统的研究呈现着上升发展趋势。为了提高金融领域问答系统的性能,提高机器阅读理解模型对金融领域数据的适应性,对机器阅读理解模型进行合理的改进,结合机器阅读理解和问题匹配技术搭建金融领域的问答系统,本文的主要创新内容如下:(1)在BM25基础上结合了问题的语义特征,添加主语和宾语语义成分因素,考虑主语与宾语的词序关系。并加入增量实验判断不同数据规模对问题匹配算法性能的影响。经一系列的实验得出本文的问题匹配算法P、R和F值都比BM25和Vmodel高,其中准确率比BM25高17.53%,比Vmodel高18.69%,随着数据增量的上升召回率、准确率与F值上升速率相比另外两种算法更加平稳,体现数据规模的变化对本文问题匹配算法影响更小。(2)在Match-LSTM基础上根据不同数据集在模型中的定位采用相应的数据重构策略,文章根据与问题或答案相关性对文章中的句子重新排序,使得文章中跟解答相关的句子被优先识别,突出相关性较大的文章的特征,对融合后的文档做自注意力机制加深问题与文章的关联,突出文章中与问题关联较深的特征,联合多篇文章再做自注意力机制突出文章语义特征与其他文章的关联性。最终验证结果达到Rouge-L和Bleu-4分别为44.65、38.37,相比Bi DAF、Match-LSTM和QANet性能更高。本文还分析不同问题类型模型的性能,本文机器阅读理解模型对实体类和描述类问题的提升相对较高。(3)结合本文改进的问题匹配算法和改进机器阅读理解模型搭建成金融领域问答系统,根据金融相关的关键字从百度搜索获取金融相关数据,按照一定的数据结构对数据进行分类整理,在金融数据下相比运用其他阅读理解模型的问答系统,本文的问答系统性能更高,并且在实体类和描述类问题的解答上性能相对是非类问题的解答更高。
其他文献
本文对融媒体背景下档案影像的拍摄技巧进行梳理与归纳,将拍摄对象划分为人物、事件、文物三类,分析这三类对象因不同的拍摄理念所使用的拍摄技巧。对融媒体背景下档案影像现
探索建立农村扫黑除恶长效机制,既要除恶务尽,又要加强源头治理。要针对农村黑恶势力发生发展的特点,发挥社会治安综合治理优势,广泛征集犯罪线索,深挖保护伞,形成压倒性态势
A银行石景山支行作为国有大型商业银行的分支机构,经过多年的发展,在个人贷款方面取得了良好的经营业绩。2018年,A银行石景山支行与大型业务渠道建立了合作关系,与此同时,A银
宿主肠道内存在的大量微生物与其健康状况直接相关,这些微生物是人和动物健康成长不可或缺的,肠道微生物通过多种途径调节机体生理功能的同时也受到体内外环境的影响。目前环
会议
当前,城乡义务教育发展不平衡不充分引发的农村劳动力大量外流、家庭教育投入加大、厌农离农思想严重等问题制约了乡村振兴的推进。因此,必须以农村义务教育为切入点,用优质
本文采用不同的合成方法得到了七种不同的硼酸盐晶体,采用单晶X射线衍射对其结构进行表征,通过元素分析、FTIR、PXRD、TG-DSC等表征手段进一步证实晶体结构,并通过紫外光谱分
研究区所属地层分区为昭通地层小区。大地构造位置位于滨太平洋构造域与特提斯—喜马拉雅构造域的交汇处,扬子陆块西南边缘部位的Ⅳ级构造单元威宁—昭通褶冲带。本文主要对研究区内的潘家寨沉积型硅石矿矿床地质特征和含矿岩系的沉积环境进行综合分析。通过收集前人研究资料、剖面测量、槽探施工、主微量及稀土元素分析、薄片鉴定等工作用于分析和探究潘家寨沉积型硅石矿的矿床地质特征;而古生物化石观察、沉积构造观察、地球化学
随着市场经济的发展,人类逐渐进入相互影响、相互制约的全球化时代,公共性问题日益成为热门研究话题。马克思和阿伦特是生活在两个不同年代的政治哲学家,对公共性问题的理解
1870年以前,德国的职业技术教育处在发展的早期阶段,学徒制在德国主导了900年。1708年实科学校创立,随后,专科学校、地方工业学校陆续创办和发展。星期日补习学校开创于16世
本文采用超效率数据包络分析法来度量公司过度投资水平,并以2007年我国制造业上市公司为样本,实证检验了董事长特征对上市公司过度投资水平的影响。研究表明:我国2007年制造