【摘 要】
:
命名实体识别(NER)是自然语言处理技术的一个重要分支,通过识别文本中的实体并标注出来,起到从自然语言中突出重点,提取用户的关键需求的目的,方便系统进一步的处理,实现用户期望的功能。智能语音电视是传统电子产品与AI结合的发展方向的代表,在人机交互上,传统的操作面板式控制机器的方式在一定的范围内将会被语音控制、手势识别和人脸识别等更加智能化的方式所代替,解放用户的双手,是人们的生活更加便捷。随着深度
论文部分内容阅读
命名实体识别(NER)是自然语言处理技术的一个重要分支,通过识别文本中的实体并标注出来,起到从自然语言中突出重点,提取用户的关键需求的目的,方便系统进一步的处理,实现用户期望的功能。智能语音电视是传统电子产品与AI结合的发展方向的代表,在人机交互上,传统的操作面板式控制机器的方式在一定的范围内将会被语音控制、手势识别和人脸识别等更加智能化的方式所代替,解放用户的双手,是人们的生活更加便捷。随着深度学习的发展,命名实体识别技术的研究有了新的思路,以神经网络为基础的命名实体识别技术在性能上有了更大的提升,智能语音电视指令识别的数据结构简单,数据量大,所以将这一结合应用在智能语音电视上,必将有非常可观的效果。本论文针对智能语音电视领域内的命名实体识别任务,研究了深度学习下的命名实体识别模型的设计与实现,在阐述了词向量的分布式表示、seq2seq、长短期记忆网络(LSTM)、条件随机场(CRF)、注意力机制(Attention)的概念、结构和原理的基础上,介绍了深度学习、Tensor Flow、爬虫的相关技术,分析了智能语音电视系统的需求,分别用活动图,实体联系图,数据流图对系统的数据和过程进行建模,对于特定领域的智能语音电视的数据集进行了收集、构造、分类、预处理等操作,给出了智能语音电视指令识别的模型结构设计,设计了整个网络的层数、神经元数目以及其他相关参数。在深度学习的方法下,实现了基于BiLSTM的智能语音指令识别的算法设计和代码实现,可视化识别的结果,测试了该方法的性能指标,针对Attention机制设计了消融实验,将LSTM与循环神经网络的其他变体,如GRU做了对比试验,统计了相关的实验结果。基于BiLSTM的命名实体识别在智能语音电视领域内的应用表明BiLSM、Attention和条件随机场的结构提取实体的可行性和高效性,功能测试的实验表明能在非常高的准确率下实现了指令的识别与标注功能,为下一步运用该结果实现智能语音电视系统的完整功能奠定了基础。性能测试的实验表明,Attention机制的有效性,加入了Attention机制的模型效果还是要优于没有加入Attention机制的模型效果,不过在本实验中效果不明显,数据集中序列较短,Attention机制只有在序列过长时才会体现出它的优势,另一个对比实验就是RNN单元的不同,本项目是LSTM,与之对比的是GRU,在性能指标上表现的相差不多。不过两者各有优劣,GRU在参数上数目少于LSTM,模型收敛速度快,但是如果数据集规模非常大时,LSTM的表达能力会更好。在本篇论文内,智能语音电视的命名实体识别任务的成功应用,证明了深度学习提取特征效果以及Attention机制结构化选取子集,避免高维运算,为整个模型的性能贡献了一份力量,期待未来会有更多技术与深度学习技术相结合,为人类创造便捷的AI+生活。
其他文献
专用汽车产业为国民经济建设提供特种车辆装备保障,是汽车工业的重要组成部分。当前,我国专用汽车产品同质化问题严重,市场竞争十分激烈,积极向产业价值链后端服务环节延伸,
文言文作为语文教学的重要组成部分,是中华民族古老的优秀文化的载体,承载着前辈先贤几千年来智慧沉淀的精华。目前语文教材中所选的篇章都是经过几千年读者眼光过滤而留下来的具有很强代表性的典范性文章,以此可以感知我们民族传统文化的精深与博大。学习文言文也是我们传承祖国优秀古典文化的必要方式。先贤留下传世至今的文献典籍,大多由文言写成,因此要想充分挖掘古典文化的精华,必须要加强文言文的学习。本文利用问卷调查
停车困难的问题日益严峻,不仅反映了停车站点现存资源的规划缺乏一定的科学性,也体现了企业对于大量停车数据信息分析利用的不完整。充分应用相关数据进行分析并制定正确的决策需要完整、科学的企业解决方案系统,现有的企业级数据管理系统更偏向于数据的查询以及存储功能,面向业务数据分析的应用仍具有一定的不足,而商务智能系统在具备数据存储、数据查询功能的技术基础上提供了面向用户的多维数据分析操作,通过运用商务智能系
线控转向系统(Steer-By-Wire System),简称SBW系统。SBW系统融合了智能控制技术与电子技术,取消了转向盘与转向前轮之间的机械连接,解决了传统转向系统的局限性。驾驶员模型
丙氨酸-乙醛酸转氨酶(Alanine:glyoxylate aminotransferase I[AGT])催化中间代谢产物乙醛酸转化为甘氨酸,这个反应是一种有效的解毒反应。食肉动物在肝细胞线粒体中催化羟脯氨酸转化为乙醛酸,植食动物在肝细胞过氧化物酶体中将乙醇酸转化乙醛酸,乙醛酸虽然本身不一定有害,但很容易氧化代谢产生草酸,生成的草酸在动物的肾脏累积,最终生成肾结石,危害机体健康。本论文通过对哺乳
主管的管理方式对整个组织的发展有着至关重要的影响,人性化的管理方式在现代企业管理中更加受到人们的重视。离职倾向作为一种消极的态度倾向,对组织的长远发展十分不利,而辱虐管理这种负性的管理方式更会激起组织成员的排斥心理,它不仅会影响焦点员工的心理和行为方式,并且会对感知到辱虐管理的第三方造成不同程度的消极影响。以往的辱虐管理研究中,很少有学者立足第三方的视角来探究辱虐管理的作用机制,对替代性辱虐管理缺
伴随《普通高中地理课程标准(2017年版)》的颁布,地理教科书迎来了新一轮的修订。新教科书的修订以培养地理核心素养为主要目标,教科书的结构、案例选择、呈现方式均有较大改
Stieltjes微分方程适用于统一描述右端不连续微分方程和脉冲微分方程,在生物学和物理学等领域有广泛的应用。本文主要研究Stieltjes微分方程解的存在性、连续依赖性与稳定性。首先,给出g-函数一致收敛与极限函数的连续性结果,单调函数极限和积分可交换的充分条件,以及线性Stieltjes微分方程对应的g-指数函数的性质。其次,研究非线性Cauchy问题,通过选取BCg([O,H],R)工作空间
本文利用机器学习方法探究股民评论情感极性,建立包含股民每日情感极性特征在内的多特征结合的个股股价涨跌分类模型,为证劵从业人员决策提供参考。总体流程分为三个阶段:首先,通过语法分析和支持向量机的方法,计算股民评论文本的情感极性数值;之后,通过聚类算法从每日股评情感数据集中选择具有代表性的评论极性特征;最后,建立基于股民情感极性特征与多种特征结合的股价涨跌分类预测模型。本文的主要研究内容和贡献如下:(
经过几十年的发展,神经网络以其出色的自学习能力,强大的非线性映射能力、容错性高、鲁棒性强、并行计算信息处理方式等特点,已在众多领域得到广泛应用。而如何将神经网络这一优势技术应用到控制学科则逐渐成为众多相关领域的研究重点,本文旨在通过神经网络的学习能力和映射能力,提高相应算法的性能指标(例:精度、速度等)。线性神经网络作为神经网络发展过程中的重要成果,本文将其与卡尔曼滤波算法耦合,并将其应用到受控状