论文部分内容阅读
在使用神经网络语言模型进行汉语框架排歧实验时,可选取词、词+词性、随机embedding矩阵及与词相对应的embedding矩阵作为特征,在2077条句子的语料上进行框架排歧实验,在给定数据集下,随着embedding矩阵迭代次数的增加,准确率也增大,当迭代次数达到7000万时,准确率最大,然后随着迭代次数的增加,准确率有减小的趋势,最后趋于稳定。把词的embedding矩阵作为特征提高框架排歧的准确率,进一步说明,深度学习在自然语言处理中的应用与仅有词及词+词性特征的若干模型对比中,词的分布式表示是有一