基于深度学习的自然语言处理中问题分析的研究

来源 :西安邮电大学 | 被引量 : 9次 | 上传用户:onlylisong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
问答系统是自然语言处理领域的重要研究内容,问题分析是该系统实现的基础,而分词处理和问题分类是问题分析中主要的处理步骤。传统的分词处理方法,难以判定过长语句中前后词语的关联,而在问题分类过程中,存在对较短语句时序判断不明确和语义深度信息挖掘不足的问题。本文利用深度学习技术,对问题分析中的分词处理和问题分类方法进行研究,构建不同的神经网络模型,通过提取问题的深度特征,改善了分词处理和问题分类方法的处理效果。本文主要工作及创新点如下:在分词处理方面,针对现有分词方法难以保证文本语义的长距离依赖关系和训练预测时间长的问题,提出了一种基于混合网络中文分词处理方法。该方法将双向门循环神经网络模型(BI-GRU)应用于中文分词处理,并利用条件随机场(CRF)模型对语句进行序列标注,有效地解决了文本语义的长距离依赖关系,缩短了网络训练和预测的时间。实验表明,该方法对于分词的处理效果与BI-LSTM-CRF模型的处理效果接近,但平均预测的处理速度是BI-LSTM-CRF模型的1.88倍,有效地提升了分词处理的效率。在问题分类方面,针对已存在的分类方法在语句时序判断不明确和深度语义信息挖掘不足的问题,提出了一种基于词频率的BI-LSTM-CNN问题分类方法。该方法首先利用改进的词频率方法提取语句的问题特征,然后利用BI-LSTM网络学习语句序列的语义关系,最后通过CNN网络挖掘语句的深度信息并进行归类。实验表明,该方法对问题分类体系中数字、描述、时间、人物和地点的分类预测F1值都高于90%,与长短期记忆卷积神经网络(L-MFCNN)模型相比较,大、小类分类预测F1值分别提升了1.07%、4.83%,提高了问题分类的准确性。
其他文献
1.引言为进一步划分和描述日本汉语学习者偏误类型并通过偏误分析促进汉语本体研究以及汉日语言对比研究,本文在已进行的研究基础上探讨副词、介词、连词、助词这四个虚词问
会议
当前,随着经济的不断快速发展,人类赖以生存的生态环境和经济发展之间的矛盾也日益突出,那么加强生态林业工程的建设,无疑可缓解这一矛盾。基于此,分析了我国生态林业工程建
<正>从没有系统的民事法,到填补我国民事基本法空白的民法通则,再到适应社会变化的民法总则,背后是中国法治跨越式发展。随着民法总则颁布实施,我国迈向"民法典时代"。女儿尚
随着社会经济的不断发展和科学技术不断取得重大突破,电力的供给对于人们的生产生活来说不可或缺,而输电线路在整个电力供给过程中具有十分重要的作用,所以输电线路的安全运
进入21世纪以来,中国汽车工业步入了一个飞速发展的时期,随着外资的引进和合资力度加大,以及自主品牌通过吸收合资的经验和并购外国成熟汽车企业等途径,使得中国一跃成为世界第一大汽车市场。而近年来,国内汽车行业市场出现低迷状态,整车产销增速继续趋缓,企业的营业收入增速也随之变缓。同时随着内陆经济的迅速发展,分流了一部分劳动力,加之受教育程度的提高,人们对工资、工作环境等要求也随之提高,劳动力成本提高和用
高校治理能力现代化也是大学职能拓展与使命的最优途径,是现代大学制度建设和高等教育现代化的着力点。高校治理能力与高等教育现代化之间是相辅相成,具有因果推动的关系。应
<正>理论是枯涩的,但生活之树常青。自然风光、文物古迹、风俗民情、国内外事件、学生生活、日常生活话题等,都是可资利用的课程资源。在"互联网+"视角下,《文化生活》课堂教
<正>周晓枫在散文《后窗》中写道:"世界可以从一个窗口涌现,所罗门王囚禁的魔鬼不断膨胀他的体积,我相信在此之前,他能缩身进入一只瓶子千年。如同我不怀疑神的一滴眼泪,能盛
食源性致病菌的快速检测是解决食品安全问题最有效的途径之一。为了实现对食源性致病菌的快速、高效、无标记的检测和分类,我们改良了原有光纤共聚焦后向散射光谱系统,将其光
教育学是人文社会科学的重要分支,循证教育学是对教育学的细化和基于证据的实践。循证教育学促使教育者将经验获取的证据与专业教学实际相结合,从而对学生的实践感受形成价值