【摘 要】
:
在“智慧法院”战略背景下,国家对于涉法涉案领域的文本理解提出了新的要求,如何让机器自动理解法律领域的自然语言文本并作出相应处理成为了迫切需要解决的难题。本文研究案
论文部分内容阅读
在“智慧法院”战略背景下,国家对于涉法涉案领域的文本理解提出了新的要求,如何让机器自动理解法律领域的自然语言文本并作出相应处理成为了迫切需要解决的难题。本文研究案件要素抽取及新闻与案件的相关性分析,旨在从法律文书和新闻文本中抽取案件要素,并在此基础上分析新闻与案件的相关性,从而为更深度的法律领域文本理解提供保证。其面临的关键问题在于如何根据案件要素的特性从法律文书与新闻文本中抽取案件要素;如何借助案件要素提高新闻与案件相关性分析的准确率。针对现有方法没有针对案件要素和法律领域文本的特点进行案件要素抽取,且没有针对新闻与案件描述的差异性对其进行相关性分析,本文对案件要素抽取及新闻与案件的相关性分析展开研究,主要完成了以下特色工作:(1)提出了语料构建的方法,构建了实验所需的语料。通过基于Xpath的网络爬虫技术从互联网采集新闻,通过规则从法律文书中生成案件要素知识库,通过标注技术和远程监督方法获得标注语料,为后续的实验提供数据准备。通过规则对裁判文书网中的17191篇文书进行解析与清洗,得到案件要素4311组,构建为案件要素知识库。通过远程监督的方式爬取新闻文档3449篇,以句为单位从中构建数据集。通过分析近年来的热门新闻,本文选择了13个热门案件,爬取与案件相关的新闻4513条。通过建立新闻与案件相关关系,得到新闻-案件对应数据4607对。(2)提出了一种基于案件领域相关性与依存图卷积的案件要素联合抽取方法。案件要素是对案件相关的事件的简要描述,对于案件领域自然语言处理任务具有指导意义。针对案件要素的案件领域相关性和内在关联性,本文利用双向循环神经网络对句子上下文信息建模,从而对案件领域相关性预测,通过与案件领域相关性预测的联合学习保证所抽取要素的案件领域相关性;通过图卷积神经网络对候选要素的依存关系进行建模捕捉到其内在的关联性,最终提高了新闻文本案件要素抽取的准确性。实验表明本文所提出方法的准确率比基线模型提高了6.6%,具有有效性。(3)提出了基于非对称孪生网络的新闻与案件相关性计算方法。新闻与案件的相关性分析是法律领域新闻舆情分析的重要环节,可转化为新闻文本与案件文本的相似度计算任务。借助孪生网络计算文本相似度是一种有效途径,其对平衡样本具有良好的学习能力,但在新闻与案件的相关性计算中面临文本不平衡和新闻文本冗余的问题,因此,本文通过计算文本中句子与标题的相似度选取与新闻标题最相关的句子表征文档,去除新闻文本中的冗余句子,利用非对称孪生网络建模,考虑到案件要素蕴含案件的关键语义信息,将案件要素作为监督信息融入到非对称孪生网络中对新闻文档和案件描述进行编码,解决新闻和案件在结构和语义上不平衡的问题,最终实现新闻与案件的相关性判断。实验表明本文提出的模型在此任务上比基线模型更适用于本任务,准确率提升了2.5%。(4)为了满足国家对于“智慧法院舆情监控系统”的战略需求,本文通过软件工程的方法进行了原型系统的设计与搭建。该系统从网上收集新闻数据,通过要素抽取模型和新闻案件相关性分析模型构建案件与新闻的对应关系,并向用户进行展示。
其他文献
随着经济的发展和制度的完善,越来越多上市公司开始使用股权激励,以期降低代理成本、完善薪酬机制和吸引保留优秀人才。然而,很多企业由于股权激励方案设计不合理等诸多因素,导致股权激励的激励效果不理想,甚至出现负面影响。本文以中洲控股改制前后公告的三次股权激励为案例,进行了相关研究。首先,本文通过对比三次股权激励方案的具体设计和实施情况,包括激励方式、激励对象及授予数量、行权价格和业绩考核条件,分析各次股
改革开放以来,根据国内外经济形势、政治环境的不同,我国对财税制度进行了多次改革和完善。然而,在直接税制度建设方面,尽管已经发现了当前直接税制度运行过程中存在的问题,
2008年,始于美国的“次贷危机”演化成席卷全球的金融危机表明,一旦风险在局部发酵,往往会在金融体系内迅速扩散,而后将会蔓延至整个宏观经济,形成“多米诺骨牌效应”,最终导致经济衰退。随着我国加大金融服务实体经济的力度,两者联系更加密切,实体经济行业的不良发展容易导致风险在各行业中加速集聚,进而对金融业造成不可避免的风险冲击。因此,金融与实体行业间的风险溢出效应值得关注。加之,在中美贸易摩擦背景下,
近年来,可见光通信(Visible Light Communication,VLC)技术的研究不断升温,VLC系统传输速率不断提高,应用场景不断丰富。与传统无线射频(Radio Frequency,RF)系统不同,VLC系
随着我国基础教育改革不断深化,教育家们给予小学数学建模更多的关注。数学建模是重要的数学素养之一,具有一定水平数学建模能力的学生能在实际情境中数学化地分析感知问题,运用数学知识解决问题,体会数学与实际生活的联系,感受数学的应用价值。课标提出的模型思想,进一步表明了数学的应用价值。小学阶段是培养学生数学建模能力的奠基时期,并且小学高年级学生正处在由具体运算到形式运算的过渡阶段,学生的数学建模能力的发展
2017年由美国演艺界引发的“ME TOO”运动席卷全球,让世界听到了女性的声音。不仅如此,在全球范围内,男女平权运动已经越来越频繁,大家共同呼吁抵制女性歧视行为。在企业界这
春运是我国改革开放以来社会经济生活中的特有现象,关乎亿万民众的切身利益。近十年来,在经济社会转型、政府管理思路变革、社会结构变化和国人文化情怀的影响下,春运面貌不断发生着新变化。《人民日报》最早涉及春运议题,每年看似如规程般的报道,实则具有反映现实、协调社会关系、记录时代发展等一系列功能。本研究基于新闻框架理论,运用内容分析法和文本分析法,选取《人民日报》纸质版及其官方微博2009—2019年期间
矿产资源作为一种重要的物质基础,为国民经济建设做出了重要贡献,但长期大规模的矿产资源开发,不可避免地会造成生态环境的破坏甚至生态失衡,从而引发了一系列生态环境问题,比如滑坡、崩塌、泥石流、水土流失、大气污染、占用和破坏土地资源等,这些问题不仅制约着国民经济的发展,还威胁着人民的生命财产安全。渝东北地区属于三峡库区水源涵养生态功能区,是重庆市东北部重要的生态屏障,对维持长江上游生态环境稳定具有举足轻
人才不仅是推动经济社会发展的核心资源,更是城市活力的源泉。吸引和扶持科技人才创业,是推动科技成果向现实生产力转化,助推地方转型升级、增强地方发展后劲的创新之举。栓
我国城市数量众多,需求多样,智慧城市市场潜力巨大。作为电信运营商之一的中国联通,近几年主营业务表现不佳,其中既受到经济下行的影响,也受到传统发展模式的制约,急需寻找新的盈利点来突破现有的瓶颈期,智慧城市的出现为电信运营商的转型升级提供了新的机遇。中国联通从自身通讯网络基础出发,配合较广阔的市场规模,与产业链中的企业合作,相互学习,共创互利共赢的商业模式。本文主要论述了中国联通智慧城市的发展战略问题