论文部分内容阅读
领域知识图谱中的领域实体和领域实体关系,可以作为领域知识引入众多的应用场景中。通过代码生成相关技术,生成领域应用平台上可以执行的代码,使得开发者能够基于现有领域平台更加快速地完成领域相关服务或应用的开发。领域知识图谱中的领域知识可以应用于领域平台上的代码生成的过程中,但基于领域知识图谱的领域相关代码生成存在一些问题。第一,领域知识图谱的构建,需要更多领域相关的数据源;对于来自于多个数据源的数据,需要进行数据融合以解决数据的异构性。第二,人工构建领域知识图谱的方法非常耗时,并且更新和维护都非常困难。作为构建领域知识图谱的核心工作,需要实现领域实体以及领域实体关系的自动抽取,从而实现领域知识图谱的自动构建。第三,代码生成过程中,需求描述的文本表述方式和平台相关转换关系的不完整性,需要引入领域知识以实现对需求描述中领域术语以及业务逻辑的解析和转换。本论文使用开放数据中的领域相关数据,抽取领域实体和领域实体关系,构建领域知识图谱。基于构建的领域知识图谱,实现领域目标系统代码的生成。本论文的工作主要包括如下的几个方面:(1)提出了一种异构开放数据的融合方法。对不同数据文档中的数据项信息进行融合。选取开放数据中包含领域实体的领域相关文档作为数据源,基于数据项信息和数据文档可信度的关联性,计算数据文档中候选领域实体的可信度评分,实现从领域相关开放数据中抽取领域实体。(2)提出了一种领域知识图谱的构建方法。本论文中使用开放数据中领域相关的数据,通过领域实体抽取和领域实体间关系抽取,实现多个来源领域知识数据的融合。以抽取出的领域实体集合为基础,结合领域相关代码生成过程中引入领域知识的应用,抽取领域实体的属性关系、同义关系以及领域实体间的多元关系,实现应用于领域相关代码生成的领域知识图谱的构建。(3)提出了一种基于领域知识图谱的领域相关代码生成方法。本论文中基于构建的应用于量化交易的领域知识图谱,实现策略描述文本到策略逻辑模型的转换。之后结合平台相关的转换对应关系,转化为目标回测平台的平台相关策略模型。最终使用代码模板和模板引擎实现生成量化交易回测平台可以执行的策略代码。(4)构建了应用于量化交易回测系统的代码生成系统。根据本论文中提出的方法框架,使用财务分析领域相关开放数据,构建了应用于量化交易的知识图谱。以量化交易回测平台的代码生成为背景,阐明了方法的有效性。本论文中使用领域知识图谱作为领域知识引入领域相关代码生成的过程中,消除了用户的需求描述和目标平台代码之间存在的障碍,降低了用户领域相关应用平台的使用门槛。同时通过对业务逻辑更加抽象的描述取代遵循特定平台规则的编码,也可以方便地实现代码在领域不同应用平台间的移植。