基于语境的隐式性别欺凌识别研究

来源 :新疆大学 | 被引量 : 0次 | 上传用户:ZPHZPH
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着时代的进步,人们在生活中对男、女性平等观念的认知有很大提升。然而,网络技术的飞速发展,使得人们与网络平台的参与度急剧增加,由于当前网络缺乏监管和隐匿性的特点,部分网民在网页贴吧、社交平台、网络通讯等网络媒介,大量发表性别欺凌言论,对他人进行歧视、讽刺、挖苦、甚至辱骂行为,不仅给他人心理上造成了严重的伤害,而且给社会带来很多的负面影响。网络数据的巨大和冗杂,使得人工处理这种欺凌言论,成为一种难题。然而,人工智能技术和深度学习的不断发展和进步,使得大量网络欺凌言论的有效管理和应用面临新的机遇和挑战。本文旨在利用人工智能和深度学习技术,研究网络性别欺凌文本识别方面的应用,针对自然语言处理文本识别领域的需求,提取文本特征,同时对深度学习模型算法进行应用、改善和优化,构建适合性别欺凌文本识别的智能算法模型。本文的研究内容和创新点主要包括以下几个方面:(1)构建中文性别欺凌语料库和性别欺凌语境体系。针对中文性别欺凌语料的缺乏,本文收集了今日头条、新浪微博、天涯论坛等社交网络上的性别欺凌语料,在语言专家的帮助下,对语料进行了标注,构建了中文性别欺凌语料库;同时,为了更好的挖掘文本语义特征,根据中文的语境特点,构建了有利于性别欺凌识别的语境体系。(2)提出一种基于语境、结合注意力机制的切片循环神经网络和胶囊网络并联联合算法模型(CASC)。通过该方法,可以获取时序多个层级语义高级信息,同时通过分析上下文语境,挖掘欺凌词之间的依赖关系和深层语义特征,提高了性别欺凌文本的识别率。(3)提出一种基于词向量、词性的注意力特征和独立循环神经网络语境特征的算法模型(MACINR)。一方面,该模型可以通过多层注意力特征保留文本更多重要信息,增强了欺凌词之间的内在关联,能够挖掘更多深层语义信息;另一方面,通过独立循环神经网络语境特征,可以让欺凌语句和欺凌词之间建立更多关联,提高特征的融合度,实现信息流整合,进而提高模型整体的性能,达到有效识别性别欺凌文本的效果。本文根据构建的中文性别欺凌语料库,从文本中提取词向量注意力特征和词性注意力特征,以及充分利用深度学习算法模型的优势,挖掘文本深层次的语境特征,实现了性别欺凌文本的自动分类和有效识别。
其他文献
再制造生态效率注重经济效益和环境效益的平衡与最优化,其评价研究引起了越来越多的学者的关注,但大多集中在再制造行业宏观层面或产品、零件微观层面,鲜有从中观层面对再制
面对能源危机、环境污染等问题,世界各国相继大力推动新能源汽车发展。动力电池作为纯电动汽车的关键部件,是电动汽车复杂工况下的主要故障源之一,其性能的好坏直接关系到电
我国的舞龙文化历史悠久,香火龙是舞龙种类中最闪亮夺目的类型之一,在我国多个地区均有分布。广东陈山香火龙习俗是省级非物质文化遗产代表项目,是江门鹤山地区备受瞩目的传统民俗活动,是粤港澳大湾区西翼的重要习俗文化名片。陈山村是广东省古村落,拥有较好的文化资源,正在乡村振兴战略的大背景下探索新时代的乡村发展。乡村文化振兴是乡村振兴的铸魂工程,推进陈山香火龙习俗的传承与发展是推进陈山村精神文明建设的重要抓手
城市湿地是湿地资源的一个重要组成部分,伴随着城市化进程的不断推进,人类行为的不断影响,造成城市湿地的面积不断减少、生物多样性减少、生态环境被破坏。随着人类对生活环境要求的不断提升,对城市湿地进行保护和恢复显得尤为迫切,建设城市湿地公园的需求被提出。城市湿地公园是具有湿地的生态功能和典型特征;以生态保护、科普教育、自然野趣和休闲游览为主要内容的公园。基于对城市湿地公园游客的环境教育感知与地方依恋关系
变电站中有很多电气设备,当前变电站事故形势处于频发状态,安全形势面临严峻挑战。为避免很多严重故障产生,现阶段国内的电力系统变电站基本都采取了微机五防等形式的保护系统。不过在变电站的运行期间,仍然会存在一定的问题,比如监控系统不能有效实时获取到操作票的执行状态以及作业期间无法实时监控相关的电力设备设施等位置数据。为避免出现在执行倒闸动作期间会出现漏项,使得电力系统的运行效率以及稳定性可靠性大大降低,
跟驰理论作为交通流理论的微观部分,它不仅是现代交通技术的理论基石,更是今后智能交通发展的基础。跟驰模型在交通仿真和交通控制等方面业已取得了许多重要应用成果,但仍无法很好体现车辆间的异质特性,为此需要我们对其进行进一步的研究。本文通过对全速度差跟驰模型中优化速度函数的修正,提出了考虑驾驶员和车型特征的跟驰模型,并针对该跟驰模型设计了两种交通流控制方法。首先,针对现实跟车场景中跟车间距呈现的多样化,本
TiAlSiN涂层不仅常温条件下力学性能优良,而且高温下也具有优异的抗氧化性与热稳定性使其在机械加工、工模具等领域应用前景广阔。阴极电弧离子镀膜技术因离化率高、沉积速率高、膜基结合效果好而被应用于TiAlSiN涂层制备。本文采用阴极电弧离子镀膜技术,在M2高速钢上沉积TiAlSiN涂层。通过研究沉积偏压对TiAlSiN涂层结构、耐磨性能、力学性能、抗氧化性能的影响规律,优化了TiAlSiN涂层制备
思想政治教育话语方式影响着思想政治教育的作用发挥,是增强思想政治教育实效性的前提条件,对思想政治教育的吸引力与感召力息息相关,具体而言是指思想政治教育话语主体坚持社会主义意识形态指导,处于某种语境之下,以特定方式方法对学科内容的意义进行阐述的系统。思想政治教育的语境伴随时代发展、科技进步而发生改变,网络作为一种全新的语境出场,改变着这个世界,话语方式相应发生变化。处在新旧语境变更之情形下,“变”与
本文以“Fivethirtyeight”网站为典型案例,通过文献研究法和内容分析法对突发事件中的数据新闻应用进行了分析,并对其生产模式进行了研究。本文对2016年1月1日至2018年12月31日“Fivethirtyeight”网站关于突发事件的150篇数据新闻进行了内容分析,梳理数据新闻生产流程,包括数据收集整理、可视化过程中的特点及存在的问题,相较于传统的突发事件报道方式,数据新闻制作和发布需
随着现代社会的快速发展,政务信息内容飞速增长,政务信息资源共享成为政府部门进行有效社会治理的重中之重。云端科技、互联网大数据的广泛应用与普及,使政务数据互通、信息资源共享走向了新纪元,既是机遇也是挑战。政务信息资源的有效共享与风险防范是政府信息化建设的重要内容,目前我国政务信息资源共享与风险防范还处于初步建设阶段,还存在诸多问题与不足,因此在大数据背景下,研究政务信息资源共享与风险防范,对提升政府