论文部分内容阅读
刑期预测是智能司法审判中的一个关键环节,对提高司法工作效率,维护司法审判的公平与公正,以及实现同案同判具有重要意义。本文基于中文大规模法律文书数据集,针对自动刑期预测中数据不平衡、量刑要素考虑不充分及可解释性不足的问题,尝试提出了相应的解决方案。本文主要工作如下:尝试了基于类别融合与多模型投票的刑期预测策略。本文根据刑期分布和刑期预测评价指标,对刑期类别进行融合,缓解了刑期分布不平衡和类别过多的问题。同时采用多个不同参数的深度学习模型对预测结果进行投票,提升了模型的预测效果。在相关数据集上进行实验,结果显示:采用类别融合与多模型投票策略,使所有模型在偏离度评价指标上得到有效提升(提升了5分以上)。实现了基于量刑属性的刑期预测策略。依据相关法律文件,总结归纳了对刑罚轻重有影响的量刑属性,并在量刑预测模型中引入刑期属性预测。通过量刑属性在案情描述和相关法律规定间建立映射,使模型可以捕获到案情描述中的量刑相关因素,实现对案情描述的理解。相关实验表明:利用量刑属性使模型的偏离度评价指标提升了2.22分,同时在Acc.、MR和macro-F1三个指标上分别提升了0.5%、2.9%、3.4%。探索了可解释性的刑期预测策略。首先在模型中加入BERT表示层,获得了更好的案情描述表示,实验表明:加入BERT表示层后,使模型在偏离度评价指标提升了至少2分。同时,输出量刑属性作为属性级解释,并利用输出属性筛选出相似案例作为案例级解释,还从案情描述中筛选出重要词作为另一种解释。从实验展示的示例,可以看出提供的三种解释可以帮助用户理解模型结果。综上所述,本文采用以上三种方法对刑期预测任务及其可解释性进行了探索。从数据预处理到量刑属性定义,提升模型对量刑细节的捕获能力,同时也使得模型更符合法官判案逻辑;此外,本文模型还可以为用户提供三种解释方式,为模型增加可解释性。