不确定时态信息表达模型的研究与应用

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:fire1977
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在研究不断变化着的现实世界时,时间是一个非常重要的因素。我们常以时间为依据来解释各种事实和数据,因为各种事件和实体间的潜在关系常常蕴涵在时态信息中。时态信息表达和时态推理问题涉及计算机科学、哲学、语言学等学科,在计算机科学研究中,这是信息系统、人工智能和其它过程建模等领域的核心问题。目前对时态信息处理的研究多集中于确定时态,然而在现实的许多情况下,事件的时间往往很难精确判定,所以,建立一个能全面且方便地描述各类事件的不确定时态信息、又具备一定时态推理能力的不确定时态信息表达模型,具有十分重要的意义。同时,模型的表达方法还要有利于存储和索引不确定时态信息,以使其能应用于数据库和数据挖掘等领域,发现有用的时态知识和规律。   本文是对不确定时态信息表达模型的理论和应用的研究。本文的研究始终以不确定时态信息处理为主线,以不确定时态信息表达模型的建立和应用两部分为主要内容,提出适于表示不确定时态信息的模型,并基于此模型提出针对不确定时态信息的推理、索引、挖掘的新技术和新方法。本文的研究沿着此思路进行:(1)仔细研究表示不确定时态信息的方法,提出统一的表达模型,分析模型的各类性质和时态推理能力;(2)提出适合该模型的不确定时态索引方法,便于在数据库系统中存储和处理不确定时态数据;(3)研究不确定时态信息表达模型的应用:在不确定时态数据存储和索引的基础上,提出新的时态数据挖掘(不确定时态关联规则)算法对时态数据进行挖掘,以发现有价值的时态知识。本文在上述几个方面展开研究,主要的创新点如下:   1.提出了一个统一的时态信息表达模型,不仅可以表示确定和不确定时态信息,而且还能描述定性和定量的时态关系。该模型定义了三种不确定时态元素(时间点、时区和时距),规定了各时态元素的定性关系和定量约束,并将三种时态元素统一用于表示事件的时态性质。因此,该模型能描述各种类型的不确定时态信息。在模型中,确定时态是不确定时态的一种特殊情况。   2.对不确定时态信息表达模型进行了理论分析。讨论了模型中各类时态关系的传递性,并给出时态关系间的传递关系表,提出了利用该表解决时态约束满足问题的方法;在模型上扩展了新的时态运算符,时态运算符的扩展使其能支持不确定时态信息的处理,同时证明了扩展后的时态运算符满足运算封闭性和布尔运算的基本性质。3.提出了一种结合线性逻辑和时间Petri网的不确定时态推理方法。根据线性逻辑与时间Petri网的内在类同性,将线性逻辑用于描述时间Petri网结构,并将两者结合用于表示不确定时态信息和时态关系,进行时态推理。主要解决了三个问题:用基于线性逻辑的时间Petri网表示不确定时态信息表达模型中的时态元素和时态关系;用基于线性逻辑的时间Petri网模型定义了各种不确定时态推理规则;提出了在时间Petri网中运用推理规则进行不确定时态推理的方法。相关的定理和例子表明了结合线性逻辑和时间Petri网,在不确定时态信息表达模型上进行定量和定性时态推理方法是可行且有效的。   4.提出并实现了一种基于R*树的不确定时态索引技术。改造了空间索引技术中的R*树索引技术,将其用于时态索引,并根据不确定时态数据的特征,对其进行了优化,从而在索引时减少比较的次数,更加精确地获得搜索结果,提高了索引的性能。另外,实现了一个基于R*树时态索引和关系数据库的原型系统,不仅实现了索引架构的主要功能,还实现了索引的存储功能,保证了该原型系统能够满足实际应用的需要。性能测试的结果表明,该原型系统不但在功能上得到了扩展而支持不确定时态数据,而且在性能上也优于已有的时态索引技术。   5.提出了一种基于参考度的不确定时态关联规则挖掘算法。首先研究了关联规则的评价标准,并根据现有评价标准存在的问题提出了一种新的评价标准“参考度”,应用该标准的关联规则挖掘算法不仅能更有效筛选有价值的关联规则,而且能挖掘负关联规则。提出了适于不确定时态数据的时区延展和归并算法,并在此基础上提出了一种不确定时态关联规则挖掘算法,由于结合了“参考度”评价标准,该算法能得到负时态关联规则。实验结果表明了该算法的良好性能。   6.根据本文研究的成果,设计并实现了一个时态数据挖掘系统,成功地将其应用于肺癌预警的课题研究中。该系统可以存储和索引确定或不确定的时态数据,实现了数据预处理、时态关联规则挖掘等算法,可以完成一个完整的时态数据挖掘过程,包括时态数据储存索引、预处理、时态关联规则发现、结果评估、结果展示等模块。该系统是本文提出的不确定时态信息表达模型和各种时态信息处理方法的具体应用。结合医疗数据进行肺癌预警课题(得到广东省重大科技攻关项目A1020103和广州市科技攻关项目2000-J-006-01的资助)的研究结果表明了本文提出的不确定时态信息表达模型和各种处理不确定时态信息方法的有效性和实用价值。
其他文献
本文旨在研究一种鲁棒性较强的自动指纹分类系统(AFCS),克服传统自动指纹分类方法的不足,提高自动指纹分类的准确性和鲁棒性。该AFCS包括指纹采集、方向图计算、图像分割、特征
嵌入式系统是以应用为中心的硬件设计和面向应用的软件产品开发为基础的专用计算机系统,广泛应用于制造工业、过程控制、通讯、仪表航天、消费类产品等领域。典型的嵌入式应用
警觉度可以衡量人在一定时期内保持注意力的程度,对警觉度的准确度量和估计可以被用来预防在高危作业中经常发生的严重事故。脑电信号(ElectroEncephaloGraph, EEG)是大脑中上
智能规划(AIplanning)是人工智能领域的一个重要分支,它的主要思想是:对周围环境进行认知与分析,根据指定的目标,对若干可供选择的动作及资源限制实行推理,综合制定出实现目标的规
本文详细介绍了东北电网水库调度气象信息服务系统的设计和开发工作。在此项目中,为东电公司建立了气象实况与气象预报产品采集系统、气象信息数据库、气象信息服务网站和气象
如今人们生活在一个网络无处不在的时代,例如,交通运输网、移动通信网、互联网、在线社交网等,这些网络结构复杂,人们无法直接从中提取有用信息。社区发现作为一种重要的网络
扩频技术是一种新型的通信体制,是通信领域和控制领域中的一个重要的发展方向。 本文介绍了扩频通信的数学模型、基本理论、系统构成,分析和给出它的关键技术及实现构想。
本论文主要研究汽车牌照识别中的牌照定位方法,其系统主要应用于高速公路收费口以及住宅小区车库的管理等场合。 汽车牌照识别技术主要包括三个内容:车牌定位、字符分割和
在实际的控制系统中,时滞现象普遍存在,时滞系统的最优控制一直是科技工作者重要的研究课题。随着计算机技术的发展,离散系统控制理论和技术越来越受到人们的重视,数字控制器
市场竞争日趋激烈,计算机技术和网络技术,特别是Internet/Intranet技术的快速发展,促使企业必须采用新的管理模式、组织结构和决策准则,以不断提高企业的竞争力。PDM(产品数据管理