短文本分类相关论文
为充分提取短文本语义信息,提高短文本分类精度,提出一种融合BTM和BERT的短文本分类方法BTM&BERT。综合考虑文本主题特征信息和全局语......
文本分类任务作为文本挖掘的核心问题,已成为自然语言处理领域的一个重要课题.而短文本分类由于稀疏性、实时性和不规范性等特点,......
互联网时代的文本类数据管理的关键在于高效的信息检索、深度的信息挖掘以及自然语言处理。文本情感分类作为这些技术的一个重要环......
随着网络的普及和移动化,社交网络在人们的社交生活中占有越来越大的比例,由此人们可以在社交网站上获取各类新闻消息。然而与此同......
在大数据时代,随着电子商务交易和即时通讯平台的快速发展,网络上的短文本数据日益增长。所以,从这些数量巨大的短文本数据中提取......
随着大数据时代下“审计全覆盖”概念的提出,导致审计工作中需要处理的数据量越来越大,数据种类也随之增多。使得审计人员必须使用......
以提升fastText短文本分类模型性能为目标,从获取高质量的类别特征、降低N-gram子词中低类别区分贡献度子词对模型学习高类别区分贡......
几乎所有的在线社交应用平台都存在垃圾文本,其中的垃圾信息包括广告、色情、暴力等,这些垃圾文本严重影响了社交平台的社交生态环......
在数字化时代新趋势下,传媒通信等主要领域信息达到了极速的传播推广,掀起了社交网络的浪潮。用户在各大网络平台快速的收集翻阅信......
目前,移动互联环境下累积了海量短文本数据(如微博、评论、搜索查询、客服问答等),其中蕴含丰富语义知识,但文本海量化造成了“数据......
随着网络技术的飞速发展和信息传播形式的不断变化,网民们可以在微博、微信以及电子商务平台等自由地表达自己的观点,这致使短文本......
语音是人机交互过程最自然,最符合用户需求的交互方式。亚马逊echo和谷歌home智能音箱可以通过语音控制家电。嵌入问答系统的电热......
在教育改革的大背景下,越来越多的目光聚集在基础教育上。然而传统的课堂教师大班授课模式已经难以满足当前家长、教师、学生的三......
针对短文本信息量少导致隐藏的信息难以充分挖掘和深度学习模型易受干扰导致分类准确度下降的问题,提出一种融合对抗训练自注意力......
随着国民健康意识水平的不断提升,人民对于医疗健康知识更加关注,对于获取医疗健康知识的方式也提出了更高的要求。目前网络上提供......
社交媒体的快速发展,为持续监测数百万人的个人健康报告提供了前所未有的机会。健康监测能够对疾病研究起积极作用。传统的以调查......
根据中国互联网信息中心于2021年2月发布的第47次《中国互联网络发展状况统计报告》显示,截至2020年12月,我国网民规模达9.89亿,网......
政务服务涉及群众生活的方方面面,相对应的政务网站所包含的审批事项众多,不易查找,群众即使在普遍关注的就业、住房、教育、医疗......
学位
短文本分类就是在给定的分类体系下,让计算机根据给定文本的内容,将其判别为事先确定的若干个文本类别中的某一类或者几类的过程。......
短文本数据在移动互联网时代出现井喷式爆发,但由于其存在的特征稀疏、多歧义等特点,目前针对短文本的分类算法存在着准确率低、易......
DOI:10.16644/j.cnki.cn33-1094/tp.2021.11.013 摘 要: 为快速准确地从海量新闻中挖掘用户需求,解决短文本语义关系单薄、篇幅较......
期刊
随着社交媒体的普及,短文本分类已经成为越来越重要的课题.短文本的简短和稀疏性,阻碍了常规机器学习和文本挖掘算法的应用.近年来......
近年来,伴随着计算机技术、互联网及移动互联网产业的高速发展,网民数量呈现出了爆发式的增长,以微信、微博等社交平台为代表的互......
近年来,各种各样的网络应用(如Facebook, QQ, Twitter,新浪微博等)不断涌现,伴随着这些网络应用,各种各样文本信息随之而来,其中不少应用......
短文本通常指文本长度小于160个字符,一般以手机短信、网页评论、网络聊天信息等形式存在的文本。短文本的分类问题是短文本应用领......
信息技术的急速发展在不断地改变人们生活方式的同时,也使得信息传播的形式在不断地丰富和翻新。短文本(通常文本长度小于160字符)......
随着互联网即时通讯技术的发展和普及,手机短信、即时信息、基于互联网和手机短信的客户评论、新闻评论等短文本形式的信息大量出现......
我国的互联网经过十年的高速发展,网民规模已达到3.38亿,普及率达到25.5%。网络已成为公众获取信息的主要渠道。在Internet上充斥......
随着计算机网络在各个领域中的广泛应用,产生了庞大的网络信息,其中,以手机短信、QQ聊天记录、博客评论、新闻评论等短文本形式存在的......
随着互联网的迅猛发展,信息正在以指数形式飞速增长。通过互联网人们可以轻而易举地获取大量的信息,从而对自己的行为起着非常重要......
随着互联网的普及应用,互联网已经成为影响人们工作和生活的一种新媒介。越来越多的人们更愿意通过互联网提供的各种平台表达个......
随着信息技术的迅速发展,网络上产生了海量的中文短文本数据。利用中文短文本分类技术,在低信息量的数据中挖掘出有价值的信息是当......
随着互联网的普及以及其硬件水平的快速更新,短文本的数量呈现爆炸式增长的趋势,这种趋势在用户量巨大的社交网络平台上尤为明显,......
电网系统是国家重要的基础设施和民生工程,在国计民生方面发挥着重要作用。而保护设备是整个网络中的重要基础设施,其部件多,结构......
近年来,互联网以及社交通讯的飞速发展给许多企业带来了技术的革新。企业可以通过基于互联网社交平台的投诉反馈通道,快速地收集到......
构建高质量问答系统的关键是构建高质量的问答对,在医疗领域问答系统的构建中,通过网络爬虫获取问答对难以保证知识的准确性,并且......
我国多位中科院和工程院院士在《中国可持续能源发展战略》中指出,到2050年,煤炭所占能源结构比例仍然不会低于50%。在未来相当长......
在信息时代的今天,各式各样大量的短信息数不胜数,包括手机短信、垃圾邮件、问答及推荐系统的留言、购物平台的商品评价等,及时准......
在信息时代的今天,各式各样大量的短信息数不胜数,包括手机短信、垃圾邮件、问答及推荐系统的留言、购物平台的商品评价等,及时准......
近年来,移动应用下载网站中出现了越来越多的恶意应用,它们通常会伪装成社交类、金融类、游戏类等应用。如果在分辨恶意应用时先对......
在信息时代的今天,各式各样大量的短信息数不胜数,包括手机短信、垃圾邮件、问答及推荐系统的留言、购物平台的商品评价等,及时准......
近年来,自然语言处理随着机器学习和深度学习的发展取得长足进步。海量的短式评论大部分字数较少而数量庞大,加之更新速度及时,对......
现有主题建模方法难以对复杂的文本信息进行有效的表示和利用,导致无法提取深层次的语义信息。特别是短文本数据由于存在特征稀疏......
产科电子病历作为医生全面了解孕妇和胎儿情况的主要渠道,对于提高人口的生育健康水平有着重要意义。结构化处理方案是一种对电子......