基于子格融合的概念格树形可视化算法研究

来源 :河南大学 | 被引量 : 0次 | 上传用户:carinalove
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在这个信息大爆炸的时代,研究如何对规模迅猛增长且来源多样性的数据进行可视化具有重要意义。而利用数据中的关联信息有效地辅助可视化,满足用户查询意图的多样化需求,成为当下研究的热点。通过研究发现,利用数据中的关联信息进行可视化存在两个问题。其一,在内部存储数据结构表示时,目前广泛使用树形数据结构对数据信息进行组织,虽然在浏览时层次结构清晰,但这种结构使得从根目录到查找的文件之间,只有一条唯一的通路。在用户对路径不明确的情况下,可能会在获取目标文件的过程中,进行大量的回溯。其二,在可视化方面,因树形结构不支持多路径检索,于是很多研究开始关注以Hasse图作为图形化表示的概念格结构,它通过对数据集中对象和属性之间的二元关系建立概念层次结构,不仅支持多路径检索,还具有显示对象内在关联的优点,因此将概念格应用于信息检索系统中,用于完善查询、限制搜索空间、推荐相关文档、尤其是对文档集合进行浏览。但随着概念格中概念以及概念之间关系的增加,二维平面布局的格结构容易产生边交叉现象,造成视觉混淆,导致用户浏览时遗漏目标信息。而通过三维布局构造的概念格,也会因为数据量的庞大,使得各结点交叉关联多,显示混乱,从而让用户迷失在海量的数据中。针对以上问题,本文通过结合树形结构在对海量数据可视化时层次结构清晰的优势以及概念格结构在表现数据关联关系方面的优势,提出以概念格结构存储数据信息,而在可视化时以树形结构呈现,当用户找到确定的目标对象或者模糊的目标对象时,可以通过此对象生成的子背景以少量对象和属性构造子格,呈现对象之间的关联关系,帮助用户对目标信息进行更精确的定位。拟采用形式概念分析(Formal Concept Analysis,FCA)理论对以下内容开展研究:(1)改进概念格树形可视化算法,提出多路径检索算法Lattice-to-Tree。首先,将格中的每一个对象和属性都映射到树结点中,而不是利用剪枝、对象或属性约简等方法对概念格结构进行处理;其次,对概念格中代表父子概念关系的边,不再做简单的一对一映射,而是对此边连接的父子概念求属性的差集,并为差集中的属性设置互相包含关系,生成的包含关系分别映射为树形结构中的结点和子结点的关系。(2)研究包含某个对象或属性的子格生成算法,提出子格融合算法Sub-lattice Merge。首先,计算每个对象生成的“一元对象生成子背景”,并让用户设置在可视化时应显示对象个数的阈值;其次,根据设定的阈值和各个一元对象生成子背景中对象的数量,将概念格中的对象分为可融合对象和非融合对象两类,当用户需要查看对象之间的关联关系时,非融合对象将会以生成的一元对象生成子背景构造的子格显示,而可融合对象将通过属性集合的合并,找到可依托的非融合对象生成的子格,将可融合对象添加到非融合子格中显示。最后,对以上提出的两种算法进行实现,并通过设计一个音乐文件管理系统,将两种改进算法应用到实例中,验证本研究成果的准确性、有效性。同时,改进的Lattice-to-Tree算法在进行可视化时,实现的效果更加符合用户个人浏览习惯;而通过子格“融合”的形式呈现目标对象相关的格结构,因为对象和属性的个数设定在用户最佳浏览效果范围内,不仅结构精简,同时也有利于用户发现对象之间的关联关系。
其他文献
无线传感器网络相关技术的稳步发展与成熟使其成为物联网信息获取手段中最基础的技术。部署无线传感器网络的目的在于获取被监测区域中感知对象的相关指标数据,是典型的以数
近年来,随着视频压缩技术和计算机网络技术的不断发展,流媒体技术广泛应用于远程教育、视频会议、实时网络视频传输等领域,得到了很大的发展,而流媒体技术的不断发展,同样促进了流
学位
工作流的概念起源于生产组织和办公自动化领域,它是针对日常工作中具有固定程序的活动而提出的一个概念。工作流技术通过流程化的管理方式,对相关的信息资源和人力资源进行协调管理,使业务依照一定的流程执行,从而实现业务过程的自动化。工作流引擎是工作流管理系统的核心,它为工作流实例提供运行环境。轻量级工作流引擎指的是从够用、灵活和低成本的设计原则出发,不追求工作流引擎功能的完备和复杂,只是实现其中必不可少的功
在基于802.11协议族的无线WI-FI网络中,速率异常是一种普遍现象。这是因为关联到同一个AP(Access Point,接入点)的STA(Station,终端)节点工作于相同的信道,故需要竞争传输媒
“现代远程教育”是一个发展的概念,通常指的是远程教育形态中的第三代即20世纪末出现的双向交互网络教育,计算机辅助评价是现代远程教育的一种形式,而计算机辅助测试是计算机辅
随着遥感传感器获取数据的技术渐渐成熟,方式也正在多样化,获取的数据分辨率越来越高,因此获取的影像数据量呈指数级地增长,同时也造成了单幅影像的数据大小成倍增加,对处理器计算单元和存储器存储带宽都有了更高的要求,最终造成计算机处理遥感影像数据的负荷急剧增大,产生大量的计算时间。遥感影像处理系统往往要求具有实时或准时处理大规模数据的能力,基于CPU串行架构的植被指数提取算法已经不能满足这种需求。已有的加
TeX是一种通用科技论文或文献排版软件系统。该系统适用于排版并生成高质量的数学类、物理、化学类科技论文或文献,以及五线谱乐谱等具有复杂格式的专业类文档资料。该系统同
最近几年,无线局域网应用频繁,特别是一些基于微控制器的小系统也逐渐开始使用Wi-Fi进行通讯,如基于Wi-Fi的数据采集系统、基于Wi-Fi的虚拟串口系统等等。随着这类应用的推广
目前,脊椎病已经成为我国的常见病和高发病,且已出现低龄化的趋势。随着计算机图形图像技术在医学领域内的应用,计算机辅助脊椎诊断技术得到了拓展。三维医学图像的重建可以
近年来,气象卫星监测数据报文(简称气象报文)呈现出爆发式的增长,并且气象报文的传输具有突发性等特点,对数据处理实时性的要求越来越高。使用高性能集群处理气象卫星监测数