【摘 要】
:
【目的/意义】词是语言的最小单元,词的向量表示决定了机器学习模型的构建方法。深度学习的神经网络训练得到的词向量,通过无监督的机器学习方法从海量数据中自动学习词汇的
论文部分内容阅读
【目的/意义】词是语言的最小单元,词的向量表示决定了机器学习模型的构建方法。深度学习的神经网络训练得到的词向量,通过无监督的机器学习方法从海量数据中自动学习词汇的语义特征,无需人工标注和复杂繁琐的特征工程,端到端的完成各种自然语言处理任务,带来了一种新的研究范式,成为学术界的研究热点。【方法/过程】介绍了词向量语义表示及优化方法,存在的问题及解决方法,最后指出了词向量未来的研究方向。【结果/结论】将句法特征、词形特征、(知识库)先验语义知识融入到神经网络模型能增强词向量的语义表示能力,针对词向量存在的一词多义、解释性差等问题,总结了最新的研究成果。
其他文献
根据众多光伏组件公司已公布的今年第二季度财报,整个光伏市场延续了第一季度创造纪录的趋势,其中有几个特点特别引人注目:光伏组件成本下降了!由于包括德国在内的主要光伏市
随着电力系统电力电子化程度越来越高,不同FACTS装置控制器间存在的交互影响对系统的安全稳定构成更大的威胁。该文通过建立含静止无功补偿器(staticvar compensator,SVC)与
研究了捏合法生产羧甲基纤维素(CMC)产品的pH值与产品质量之间影响关系,采用捏合法生产羧甲基纤维素,通过调整碱液添加量,生产出pH值在7.0~11.5之间的产品。在去离子水中、饱
<正>铜川是全国资源型可持续发展试点城市、全国节能减排财政政策综合示范城市、全国山水林田湖生态保护修复项目示范区。近年来,铜川成功创建为全国绿化模范城市、国家卫生
1.高尔基磷酸化蛋白2 (GOLPH2)与肺癌的相关性研究高尔基磷酸化蛋白2 (GOLPH2,又称为GP73或GOLM1),是近些年发现的一种高尔基体膜蛋白。研究表白该蛋白在很多疾病以及癌变组
近10年来,中国宏观经济稳步增长,城市化进程不断加快,道路基础建设不断完善,这些利好因素带动了汽车行业的高速发展。但情况在2018年有了变化,乘用车市场不再呈现出蒸蒸日上
<正> 数据包络分析(Data Envelopment Analysis)是运筹学的一个新的研究领域。1978年,首先由Charnes A,Cooper W W 和Rhodes E提出,并命名了这一模型(最早的模型称为C~2R模型
本文给出了成透视对应的点列和线束的交比相等定理,在无穷远元素情形下的代数法证明,补充了高等几何中的一个重要定理,在一些高等几何教材中未涉及的不够严密的方面。并为本
对春小麦后复种蔬菜、油料、粮食、饲料作物等不同复种模式与传统栽培模式进行示范对比、效益分析和评价,结果表明:麦后复种蔬菜的粮菜模式、麦后复种小杂粮的粮粮模式经济效