【摘 要】
:
命名实体识别是自然语言处理的重要内容,它的研究和实现具有重要的理论意义和实用价值。但目前这方面的研究多集中在现代文献领域,古籍中命名实体的识别是古典文献信息化进程
论文部分内容阅读
命名实体识别是自然语言处理的重要内容,它的研究和实现具有重要的理论意义和实用价值。但目前这方面的研究多集中在现代文献领域,古籍中命名实体的识别是古典文献信息化进程中的关键所在,是一个值得探索研究的问题。本文以《三国演义》为例对基于条件随机域(Conditional Random Fields,CRF)的古籍地名自动识别做了一些探索,本文的结构和主要内容安排如下:第一章、绪论首先说明了本文研究的目的、意义。再围绕本文中心任务介绍了相关的基础理论和研究背景,主要是自然语言理解的含义和思想,还简述了古代文献电子信息化的研究现状和前景。第二章、命名实体的识别及其方法先引出命名实体识别这个问题,然后介绍了命名实体识别的意义和方法,重点在基于统计的方法。第三章、CRF模型CRF模型是本文中研究古籍地名自动识别的主要方法,本章就是从理论上对CRF模型的介绍,重点讨论了该模型应用于命名实体识别时的情况。第四章、基于CRF模型的古籍地名自动识别——以《三国演义》为例这一章是本文的核心部分,以《三国演义》为实例,分三个阶段共13个步骤具体详细地介绍了利用CRF模型对古籍地名进行自动识别的实验研究过程。第五章、结语最后对本次研究工作进行总结,并对今后的后续研究作出展望。
其他文献
"数感"是对数字关系和数字模式的意识、敏感性,以及运用这种意识灵活地解决数字问题的能力。"数感"的培养已作为义务教育课程改革的首要目标被提出。因此,从小学低年级教学开
连续输送设备是港口的主要耗电设备,在能源问题日益突出的今天如何更好的节约用电是值得我们为之不懈努力的课题,为此,本文将结合港口实际情况,研究连续输送设备的节电技术。
介绍了近年来在水文、工程、环境物探领域中兴起的高密度电阻率勘测方法的基本原理,并针对内蒙古扎鲁特旗南部地区开展高密度电阻率法测试的研究与应用。通过高密度电阻率法
<正>《中国书法》:欧阳先生,您曾经自谦地给自己总结过十六个字:"少无大志,见异思迁,不务正业,无家可归"。怎么理解这句话呢?欧阳中石:我为什么说少无大志呢?我从上小学开始
本文以浏阳市柏加镇为例,运用实证研究的方法,采取问卷调查和参与式调查相结合的方式,对柏加镇花木产业发展进行了实地调查。在概述柏加镇花木产业发展现状及存在问题的基础
<正> 應中蘇友好協會總會之請來中國講學的蘇聯三教授,生物學博士努日金,史學博士吉謝列夫及經濟學碩士馬卡洛娃於三月二日到達北京。吉謝列夫博士是在本年獲得斯大林獎金的
本文通过介绍学习动机的含义及分类,学习动机与学习的关系,学习动机对学习的影响,进一步提出学习动机培养与激发的方法。
正确认识和分析国内家具行业的发展现状和趋势,扬长避短、把握机遇,从整体上了解和分析家具行业的发展动向、前景以及战略和政策取向,实现家具行业的全面、有序、可持续发展
随着煤炭资源的枯竭和生态环境的恶化,寻求煤炭产业可持续发展道路成为当下煤炭企业的主攻方向。实行产业链延伸对煤炭企业来说既是一个巨大挑战,也是依托技术创新走内涵式和
<正>上世纪末以来,作曲家们陆续应用了一些新的和声技法——通常称为“近现代和声技法”.拉氏选用这些技法的基本原则大概是:看它是否能与传统和声技法及他所爱用的色彩性技