【摘 要】
:
诗歌作为一种特殊的文学体裁,其计算机模拟生成被视为自然语言生成领域的一大挑战。本文以汉语古典诗词为研究对象,对机器自动生成宋词的可能性和具体实现方法进行了详细的研
论文部分内容阅读
诗歌作为一种特殊的文学体裁,其计算机模拟生成被视为自然语言生成领域的一大挑战。本文以汉语古典诗词为研究对象,对机器自动生成宋词的可能性和具体实现方法进行了详细的研究和讨论。本文的研究内容主要有以下几大方面:1、对诗歌生成领域到目前为止的研究成果进行了总结和分类,介绍了每种方法的主要步骤和代表性诗歌生成系统。并对中国古典诗词的计算语言学研究进行了综述。2、建立宋词语料库。通过对格律的研究将词句细分为子句,对子句字串进行统计,综合利用频率、共现度等参数抽取结合强度高的字串,并结合各种已有的词典资源来建立宋词词表。采用条件概率等方法对已切分的宋词进行注音,建立音韵数据库。3、建立宋词生成相关的语法规范,提出用确定性自动机(DFA)进行词句语法合法性判断的方法。进行语义度量的计算:采用潜在语义分析和互信息两种方法计算词义相关度;采用词典和语料库统计相结合的方法计算词义相似度;成立专家组对高频词进行风格和情感的分级评判。4、提出基于遗传算法的宋词生成模型。根据宋词特点,设计了基于平仄的编码方式、基于语法和语义加权值的适应度函数、基于精英主义和轮盘赌算法的选择策略、部分映射和启发式交叉算子和启发式变异算子。并详细介绍了各主要操作的实现步骤。5、建立基于遗传算法的宋词生成系统,给出系统框架、主要实现流程和宋词生成实例。对实验结果进行了分析和总结。实验结果表明,本文建立的计算模型和设计的系统初步实现了计算机自动生成宋词的目标,为今后进一步的研究提供了理论和实验基础。
其他文献
论文以某公司企业财务信息集成系统建设为背景,讨论了基于Web的企业财务应用系统研究与开发。在企业客观条件的限制下,传统财会管理与技术上存在很大的局限性,使得各种架构系
图形用户界面(GUI)软件测试是GUI软件开发中非常重要的一个环节,是保证软件质量、提高软件可靠性的关键。GUI不同于传统软件,它提供了使用者一个非常直观易于使用的环境,因此
径向基函数神经网络以其简单的结构,优良的全局逼近性能而引起了人们的广泛关注。由于径向基函数神经网络的独特的拓扑结构和训练方法,使得它在函数逼近和非线性系统预测等领域
最大化多样性分组问题是一个来源于实践的组合优化问题,在给出一个元素集合对应的距离矩阵的条件下,要求将其分成若干组,使得多样性最大。该问题在现实中有很多应用,而且已经
网格计算是解决科学计算、工程计算和商业计算等大规模计算的下一代极具潜力的计算平台。网格核心服务是网格的重要组成部分,是连接网格底层和高层功能的纽带,是协调整个网格
“珠峰自然保护区生态旅游自助服务系统”是在充分调研、分析和野外调查基础上,利用WebGIS技术,设计开发的应用于珠峰保护区的WebGIS系统。针对珠峰自然保护区的特点和系统需求
图数据信息的应用极其广泛,存在于科学技术的各个领域,因此经常会遇到图数据信息中有关可达性查询的计算问题。随着数据量的急剧增长,传统的可达性计算方法已经无法满足大型
差分演化算法,自1995年被提出以来,受到了相关领域中专家学者们的重视和青睐,并且已经在多峰函数优化、数据过滤、多目标优化等十九个大方向上得到了较好的应用成果。本文主要对
网格任务调度算法是网格研究核心内容之一。如何合理的将作业分配给不同的资源,以使整个网格系统达到最佳的性能,这就是任务调度要解决的问题。由于网格系统的异构性和动态性,以
目前,故障诊断已经发展到了智能阶段,而智能故障诊断技术的研究重点已经逐渐由传统的人工智能转向新兴的计算智能领域。计算智能领域的一些理论,如人工神经网络,粗糙集理论等