基于免疫多词主体自治学习的情感分析研究

被引量 : 0次 | 上传用户:oncecao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
情感文本指作者对人或物或事做出的有情感极性的评论性文本,其中情感信息包含评价持有者、评价对象、评价词,以及修饰成分,它反映了人们对事物的态度。文本情感分析指借助自然语言处理技术从情感文本中识别和获取情感信息的方法。但由于词的情感极性受上下文影响而难以准确判定,评价对象和评价词之间难以建立准确的对应关系,以及情感表达方式的多样性等因素,文本情感分析研究面临巨大挑战。近年来,大量学者针对词汇、短语、句子,以及篇章等不同粒度的情感文本展开研究,并尝试借助它提高产品推荐、自动问答,以及信息检索等系统的性能。基于统计机器学习的文本情感分析尽管作为主流情感分析方法受到广泛关注,但存在需要大规模标注语料用于模型的训练和评价以及无法通过持续学习提升性能等缺点。本文尝试借助适应性免疫原理构建新的机器学习模型克服上述缺点。首先,本文提出判断词汇和句子情感极性的半监督学习模型,尽管提高了挖掘情感词和句的精度,但也进一步暴露出基于统计机器学习的情感分析的不足,这成为构建新的机器学习模型的出发点;然后,受人体免疫系统与人类语言系统的相似性启发,构建基于适应性免疫原理的自治机器学习模型。借助浆细胞负向调节机制构建基于多主体复杂系统建模的人工免疫系统,搭建模型基础平台,进而通过将词汇模拟为参与免疫反应的细胞和分子构建多词主体自治机器学习模型;最后,借助该模型实现情感要素分析。主要研究内容包括以下四个方面:1.在基于统计机器学习的情感分析研究方面,提出基于集合相似并的半监督情感分析模型。该模型以情感流图为基础,首先,获取情感候选对象,进而借助情感词典构建情感流图,图中节点是候选情感词或者句子,而边包括两种:节点之间的语义关系以及节点的初始情感极性;然后,借助Ford-Fulkerson算法将该流图分割为子图;最后,借助集合相似并方法将所有子图中的节点合并为积极和消极两个情感集合,实现节点的情感极性判断,并且结合基于自训练的半监督模型进一步提高情感分析性能。2.在构建模型基础平台研究方面,提出基于浆细胞负向调节机制的人工免疫系统。浆细胞负向调节机制指出浆细胞可以与T细胞结合进而使T细胞死亡,实现负向调节T细胞种群的多样性,从而提高T细胞与B细胞交互效率,进而提高适应性免疫反应的效率。以克隆选择原理、负选择原理、独特型免疫网络原理,以及浆细胞负反馈机制为理论基础,以基于元胞自动机的多主体复杂系统建模为建模方法,将参与适应性反应的免疫细胞和分子模拟为主体构建人工免疫系统,实验表明该模型不仅能够实现对适应性免疫反应较真实的模拟,而且验证了浆细胞负向调节机制有效性。3.在新的机器学习模型研究方面,提出基于适应性免疫原理的多词主体自治学习模型。以适应性免疫原理为理论基础,以面向自治计算的多主体复杂系统建模为建模方法,将词汇模拟为参与适应性免疫反应的细胞和分子,词汇之间的关系模拟为免疫细胞或分子的受体之间的特异性关系,关系强度为受体间的亲和度来构建免疫词主体。在适应性免疫反应中,通过在免疫词主体的交互、克隆、变异和选择行为作用下,进行免疫词主体自治学习。在不断学习作用下,达到优化词主体间特异性关系(即词汇关系)的目的。4.在以上工作基础上,提出基于多词主体自治学习模型的情感要素分析模型。首先,构建情感要素分析目标函数。其次,将词汇模拟为参与适应性免疫反应的B细胞和抗原,通过模拟B细胞和抗原的受体、行为、状态、以及交互策略构建免疫词主体;最后,在适应性免疫原理作用下通过不断的免疫反应优化词汇之间的关系,进而实现优化评价对象和评价词之间的关系,达到提升优化目标函数的目的。综上所述,本文致力于通过模拟免疫细胞和分子在特异性免疫反应中的行为、状态,以及策略,进而基于适应性免疫原理构建多词主体自治机器学习模型,并将其用于克服现有文本情感分析方法的缺点,取得了一些初步的研究成果。随着该模型的进一步研究以及新的免疫原理的不断发现,相信基于适应性免疫原理的多词主体自治机器学习模型的研究在未来会取得更大的突破。
其他文献
在日常机械故障诊断中,采用常规谱就能对设备的故障进行分析诊断,但是某些电气故障在常规谱里无法识别,容易跟机械故障相混淆。介绍如何运用频谱细化谱对电气故障进行识别诊
我国有悠久的民俗文化传统,民俗体育风姿绚丽,五彩缤纷,传统体育项目和小型多样的民间体育竞技体育相结合,是新时代体育教学的一个努力方向,民俗体育教学应结合本地区自然条件,气候
<正> 取维生素B15~10片,捣烂成粉,加入温水中洗浴,残留在皮肤上的维生素B1能散发出一种特殊气味,使蚊虫“闻”而生畏。这种驱蚊效果可保持2—3天,且无任何副作用。
对于边坡整体稳定分析,找到了一种用随机角来搜索随机滑动面的新方法。在此过程中,采用简化Janbu法计算安全系数。这种新方法产生随机滑动面的过程是:先假定滑动面与边坡上、
基因组定点编辑(site-specific genome editing)是指在基因组水平上对生物DNA序列进行定点改造的遗传操作技术,其在基因功能解析、动植物遗传改良和新品种培育等方面具有重大
双53cm激光发射接收望远镜用于空间目标的光电探测研究,望远镜建成后,既能单独跟踪空间目标,又能与现有1.2m望远镜同步跟踪同一空间目标。望远镜由光学系统、机械系统、控制系统
<正>背带是贵州少数民族必不可少的背孩子的工具。它最集中地体现了妇女们纯真的母爱,囊括了最多的思想内涵和最撩人心弦的艺术语言。每个背带纹样都有着优美的故事和神奇的
党争问题研究一直是中国古代史研究的热点问题,宋代党争研究长久以来主要着眼于对北宋后期党争的研究,如神宗朝党争、元祐党争,且研究成果丰富,是研究北宋政治必须了解的,也是应当