论文部分内容阅读
立案登记制是中国司法制度改革的重大举措,该规定明确指出法院只对诉状进行形式审查,符合要求的应当一律接收,并在规定期限内依法结案。此外,当前人们的法治意识普遍增强,导致法院受理案件数量出现大幅度增长。传统司法审判流程是由法官根据原被告的事实陈述,对案件做出审判结论。法律审判需要法官具有专业的知识储备,同时还需要根据案件事实查阅大量相关法律法规,引用相关法条来作为判决依据。多种因素的综合作用,使得法官等司法人员的日常工作面临诸多挑战。中国裁判文书网,实现了全国案件审判结果的电子化记载。裁判文书网虽自带检索功能,但返回结果为所有符合条件的裁判文书,对于缺乏法律专业知识的用户来说,检索很难达到预期效果。这时就需要一个法条预测系统,来帮助司法工作者提高工作效率,满足当事人的法律咨询需求。传统法条预测方法是将法条预测任务抽象为多标签文本分类问题,采用TextCNN或TextRNN等算法预测法律事实对应的法条,但因为训练数据集和任务的不同,算法泛化能力较差。法条预测系统面临的主要难点有:1.裁判文书的结构类似,相似度较高;2.相关类似法条差异不大;3.通常一个案件将涉及多个法条。为解决上述三个问题,本文创新性的提出了基于多模型融合的法条预测算法,该算法可以根据阈值大小确定最终输出的法条。本文的主要工作内容如下:(1)、融合法条特征的单模型法条预测算法传统的法条预测算法仅将法条分类作为单纯的分类编号看待,没有考虑法条本身蕴含的信息。对此,本文提出了融合法条特征的法条预测算法,该方法通过TextCNN模型提取法条和法律事实文本特征,显著的提升了法条预测的效果。针对CNN模型卷积核的视野大小固定,无法建模更长的序列信息,超参调节繁琐等问题,本文进一步提出了基于LSTM注意力机制模型的法条预测算法,结合Attention机制衡量每个关键字的贡献程度,从而产生法条预测列表,仿真实验结果表明,该模型相对于TextCNN模型Fmacro指标具有显著提升。(2)、基于多模型融合的法条预测算法针对单模型法条预测算法在不同数据集下测试效果不是很稳定,泛化能力较差的问题,本文提出了基于多模型融合的法条预测算法,将不同参数的单模型预测算法通过概率相加的方式进行融合,达到模型互补的效果。实验表明加权融合后的算法Fmacro及Fmicro指标均优于单模型算法。(3)、基于多模型融合的法条预测系统设计与实现以多模型融合的法条预测算法为基础,将研究成果应用到实际项目中。通过文献综述、需求分析了解系统的实际功能需求,使用Python作为后端开发技术,Uniapp作为前端开发框架,从而使预测系统可以在多平台运行,最终实现可以多平台使用的法条预测应用。本文设计实现了基于多模型融合算法的法条预测系统,包含了融合法条特征的TextCNN、TextRNN等多个法条预测算法。在设计时分别将算法进行一系列实验并进行比较、分析,结果显示基于多模型融合的法条预测算法相较于其他单模型算法准确性更高,适用性更强,且多模型融合具有可扩展性,可以在今后的应用中根据需求的变化进一步改进。