命名实体识别在无效文本过滤中的应用——过滤影视作品中的无效评论

来源 :电子技术 | 被引量 : 0次 | 上传用户:zxcvbnmzhaowei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文章基于自然语言处理中的命名实体识别和语义角色标注方法,提出了一种视频网站电视剧无效评论过滤的方法。首先通过爬虫获得足够的视频网站电视剧评论、分集简介和基本演职人员的信息;其次,使用基于条件随机场的命名实体识别方法对简介进行命名实体提取,使用语义角色标注的方法对简介进行剧情相关词的提取;最后,通过使用前两步建立的关键词词典、情感分析技术与评论长度判断相结合的方法进行无效评论的过滤。实验结果表明,视频网站电视剧的无效评论大约占总评论数的13%左右,这种方法可以有效的过滤掉视频网站电视剧中大部分无效评论。
其他文献
提取沪深股市42家电力上市公司的2001年年报的数据,采用了熵评价法,对电力上市公司综合实力进行了综合评价.在用熵评价确定权重之后,又提出一种变异系数权重检验方法,用以确
作为一种典型的多模态话语形式,儿童绘本在儿童娱乐及教育等方面起着重要的作用。以符际互补理论及视觉分析框架为理论基础,结合系统功能语言学人际意义有关概念对中国儿童绘
面对融媒体时代的来临,全面把握媒体融合发展的趋势和规律,对我们党的建设和长期执政有着至关重要的影响。为进一步推动融媒体融入基层党建工作,打造智慧党建,构建新时代大党
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
会议
在分散解耦的系统框架上,提出了基于MIMO过程互相关函数的神经网络解耦器在线学习算法.该算法定义了一组MIMO过程的互相关函数作为神经网络解耦器的指标函数.采用了混合遗传
在当下倡导中国文化走出去的社会语境中,霍克斯英译本《红楼梦》在二十世纪后半叶享誉海内外,引人深思。为了让西方读者在阅读《红楼梦》时感觉是在欣赏英文原版小说,而不是
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
会议