论文部分内容阅读
近年来,人工智能技术已经广泛应用于司法领域,为其提供了强大的技术支撑,推动了司法领域的信息现代化和智能化。本文研究基于文本蕴含判别的法律案例模拟系统评价方法,其中诉讼请求评价需要根据判决结果推理判断诉讼请求是否成立,是评价任务中最难的一项,该方法通过将诉讼请求评价问题转换为文本蕴含判别问题,以实现对诉讼请求的评价。论文主要工作包含以下几方面:(1)开发了诉讼请求和判决结果蕴含数据集。该部分的主要工作是从裁判文书网现存的海量判决书中提取诉讼请求和判决结果后,结合判决书本身的特点和法律案例模拟系统评价的实际需求,设计合适的标注规范,完成了数据集的开发。(2)研究基于可分解注意力的诉讼请求评价方法。该方法是本文的基准系统,主要采用双向长短期记忆网络学习上下文信息,然后利用可分解注意力机制获取句子对的交互信息,对交互后的信息进行比较后通过分类器判别蕴含关系。(3)提出了基于组合注意力机制的诉讼请求评价方法。由于长短期记忆网络在长文本中容易损失一些重要的长距离依赖,因此该方法加入自注意力机制捕捉任意长度的句子内部的依赖信息,同时通过高速路神经网络解决因网络深度增加后的训练困难问题,取得了很好的效果。(4)提出了基于记忆网络的诉讼请求评价方法。针对长短期记忆网络中通过细胞状态产生的历史记忆较小,无法准确记录文本全部内容的问题,该模型使用记忆网络中可读写的外部记忆存储模块,利用推理组件对其进行训练,最终获得可灵活操作的记忆模块来增加记忆;同时,在句子编码时融合多头自注意力机制捕捉不同角度的句子内部结构信息以增强句子的结构语义。实验结果表明,相较于基准系统模型,基于组合注意力机制的诉讼请求评价方法具有较好的性能,且基于记忆网络的模型得到了比前两者更优的结果。