基于CNN的消费品缺陷领域词典构建方法研究

来源 :数据分析与知识发现 | 被引量 : 0次 | 上传用户:yw1234c
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
[目的]有效地构建消费品缺陷领域词典,有助于了解专业领域动态与领域关键信息.[方法]首先,通过语料中的词频特征挖掘领域相关短语词;其次,使用TF-IDF算法构建领域词库以减少人工标注成本;最后,基于卷积神经网络(CNN)模型融入语义、位置信息进一步生成领域词典,提升领域词典的健壮性与泛化能力.[结果]实验结果表明,本文方法与统计学习方法相比,在准确率、召回率和Fl值上提升了6%-9%.[局限]仅在消费品缺陷领域文本上构建词典,在其他领域的效果有待验证.[结论]基于CNN的消费品缺陷领域词典构建方法可以提升消费品缺陷领域词典的构建效果.
其他文献
[目的]以具有时间属性的公众城市认知数据为研究样本,探寻城市画像主题变化特征与规律.[方法]选择城市旅游业为研究分面,利用LDA主题模型与多维度城市画像主题描述框架,从主
[目的]提出并构建网络热点事件话题漂移指数,体现网络热点事件话题变动幅度.[方法]利用LDA主题模型对网络热点事件进行话题抽取并结合词权重分析话题漂移情况,提出网络热点事