基于条件随机场的法言法语实体自动识别模型研究

来源 :数据分析与知识发现 | 被引量 : 0次 | 上传用户:huangyi802
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
【目的】法言法语实体的自动识别是实现裁判文书文本挖掘的重要的基础性工作。【方法】采用爬虫方法获取数据,人工方式进行语料标注,利用NLPIR加载法律领域词典对语料进行分词,结合法言法语的内部和外部特征构建基于条件随机场的特征模板,自动识别语料中的法言法语。【结果】融入法言法语内部和外部特征的条件随机场模型,自动识别法言法语的实验效果良好,模型的调和平均值达到90%以上。【局限】法言法语实体自动识别模型在领域的扩展上有一定的局限性。【结论】基于条件随机场对法言法语实体实现自动抽取是可行的。 【Objective】 Automatic recognition of French-speaking French is an important basic work to realize the text mining of referees. 【Method】 Data were acquired by reptile method, corpus was annotated artificially, NLPIR was used to segment the corpus in the domain of legal field, and combined with the internal and external features of French dialect, a feature template based on conditional random field was constructed, and the method of corpus was automatically identified Speak French. 【Result】 The results show that the experimental results of French-French automatic recognition method are well integrated into the conditional random field model of French internal and external features, and the average harmonic value of the model reaches more than 90%. [Limitations] French legal entities automatically identify the model in the field of expansion has some limitations. 【CONCLUSION】 It is feasible to automatically extract French-speaking French entities based on conditional random field.
其他文献
中小学素质综合评价工作,作为新课程评价体系中的一项重要内容,是开展素质教育的必然要求,是促进学生全面发展的必然要求,是造就高素质人才的必然要求。笔者在多年的学生管理
基于1982—2014年GIMMS NDVI3g数据集,分析中国沿海地区生长季归一化植被指数(NDVI)的时空变化特征,探讨NDVI对极端气温和极端降水年尺度和月尺度的响应特征。结果表明:中国
随着国内经济的发展壮大,中国在人口城市化的道路上越走越快,随之带来的是城市交通压力的日益严重,现有的地表城市道路已无法满足人们的需要,地下交通的发展势在必行。地下交
本文结合"飞思卡尔"智能车大赛,从培养学生的综合实践能力、团队合作精神以及创新能力等方面,探讨了学科竞赛在高校教学活动中的重要作用。实践证明,学科竞赛在加强大学生动手
目的探讨独活寄生汤治疗腰腿痛的临床效果及特点。方法选取2011年1月-2015年12月我院中医科收治的580例腰腿痛患者,按照治疗方法的不同,分为实验组(n=290)和对照组(n=290)。