基于联系数的位置不确定数据流聚类算法研究

来源 :浙江工业大学 | 被引量 : 0次 | 上传用户:srsyzjks
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
不确定数据流在许多应用中起着关键作用,作为一个重要的研究课题,在学术界引起了众多研究者的关注。而位置不确定性作为一种新的不确定数据类型,在物联网高速发展的今天,拥有极高的研究价值。该论文针对当前位置不确定数据流聚类算法存在的问题,主要进行了如下研究工作:
  1.提出了位置不确定数据模型。在不确定数据流聚类算法的研究中,位置不确定性是一种新的不确定数据类型,已有的不确定数据模型不能很好地描述和处理位置不确定性数据。鉴于此,提出基于联系数的位置不确定数据模型、联系距离函数、微簇密度可达性等主要概念。
  2.提出了基于联系数的位置不确定数据流距离聚类算法——UCNMicro。使用了针对位置不确定性的不确定性数据表达新模型,定义了不确定数据对象间的联系距离,运用基于密度峰值思想的初始化策略,使用当前簇和候选簇构成的两层簇窗口,并动态调整窗口结构。最后分析了算法的计算复杂性为线性复杂性,实验结果表明,UCNMicro算法的聚类处理时间和聚类结果在聚类精度方面优于已有算法,具有较快的聚类效率和较好的聚类精度。
  3.提出了基于联系数的位置不确定数据流密度聚类算法——UCNStream。UCNStream算法采用了在线/离线两级处理框架,使用基于密度峰值思想的初始化策略,定义了新的可动态维护的微簇聚类特征向量。利用衰减函数和微簇删除机制对微簇进行在线维护,准确地反映了数据流的演化过程。最后,分析了算法的计算复杂性,并通过对实际数据集上的实验与几种优秀的聚类算法进行了比较,实验结果表明,UCNStream算法具有较高的聚类纯度和处理效率。
  4.提出了基于联系数的位置不确定数据流群智能聚类算法一一UCNFlocking。将群智能的思想运用到不确定数据流聚类中,在UCNStream算法的基础上,利用和修正了群聚行为的三个原则,将其用于聚类分析。本文将群聚行为拓展到多种群的聚类,通过空间映射和群智能的加入,减少了运算量。实验表明,基于多种群智能的位置不确定数据流聚类算法,有效提高了计算效率,实现了可分布式处理的在线实时聚类,算法具有可以发现任意形状簇且对噪声数据不敏感的优点。
  论文通过将联系数的相关理论灵活运用到位置不确定数据描述上,成功构建了新的不确定数据模型。在此基础上,提出三个具体算法,分别采用基于距离、基于密度和基于群智能的聚类方式,解决位置不确定数据流的球状簇聚类、任意形状簇两级处理框架聚类和在线实时任意形状簇的聚类问题。与已有的不确定数据模型和其基础上的不确定数据流聚类算法相比较,文中的算法更有效地利用了数据对象的空间位置关系,对位置不确定数据流的数据挖掘研究有实际意义。
其他文献
该文收集整理了近20年国内外中药汤剂治疗儿童自闭症的相关文献,从病因病机、辨证分型与治疗等方面进行综述。
随着光伏发电技术的迅速发展,大型光伏电站陆续投入运行。由于光伏组件安装在室外环境中,持续暴露在恶劣的环境条件下,各种故障问题日益凸显。光伏系统故障严重影响了系统的发电效率,甚至会引发一系列安全问题,增加了运维的经济成本,所以其可靠性也越来越受关注。光伏组件作为光伏发电系统中的核心部件,其可靠性是影响整个系统性能的关键,因此光伏组件的故障诊断显得越来越重要。  针对光伏组件的故障问题,通过实地调研实
学位
孤岛微电网系统中,频率的动静态性能是系统可靠稳定运行的重要保障,通常采用基于底层逆变器的一次调频控制和基于中央控制器(MGCC)的二次调频控制相结合的方法来维持系统的频率质量。微电网逆变器的下垂控制策略相当于电力系统中的一次调频环节,属于有差调节,为了实现频率的无差调节,可以通过基于PI调节器的集中式二次频率控制来改变系统中多个调频单元的输出功率,但是微电网中发电单元的投入和切出均会导致系统模型和
纳米Sn02是一种重要半导体材料,晶体结构为金红石型,具有导电率高、透明度高和稳定的化学性能等优点,在气敏探测器件与太阳能电池领域中具有广泛应用。本文通过改变水热法中的盐浓度、反应时间和水热温度等参数制备具有不同晶体结构的Sn02纳米薄膜。采用SEM、三维超景深显微分析仪等对样品进行检测,并对Sn02纳米薄膜的表面完整性与平整度、微观结构、比表面积等进行观测与分析。研究发现:随盐浓度增大,形成晶体
作为航空母舰上舰载机起飞的主要设备,蒸汽弹射器提高了起飞的效率,保障了人机的安全,因此对舰载机蒸汽弹射起飞技术进行深入研究非常重要。舰载机的蒸汽弹射过程对湿式储汽筒、弹射杆、前起落架、舰载机等的性能要求很高,故而弹射安全问题显得尤为重要。本文针对舰载机蒸汽弹射起飞主要安全影响因素进行分析与研究,主要研究内容如下:  首先,考虑舰载机弹射起飞实际作业情况,建立了包含蒸汽弹射器热力学模型、牵引释放装置
学位
学位
该论文利用Lyapunov-Krasovskii稳定性理论和Lyapunov-Razumikhin稳定性理论,研究参数不确定性时滞系统的鲁棒控制.建立在状态空间模型的基础上,考虑了不确定性时滞系统的鲁棒镇定问题,基于观测器的鲁棒控制器设计问题,鲁棒变结构控制问题,鲁棒H控制问题,鲁棒保性能控制问题,分别给出上述几种时域鲁棒控制系统设计的新的结果.
从理论基础上看广泛应用的模糊推理尚不完善,该文的研究工作是基于具有良好性质的算子R的三Ⅰ方法.主要包括以下几个方面:1.针对Zadeh提出的已获广泛使用的CRI方法的缺陷与不足,进一步完善和发展了模糊推理的三Ⅰ方法的理论,给出了基于Lukasiewicz蕴涵算子R的三Ⅰ方法的模糊FMP算法与模糊FMT算法的计算公式,并考虑了三Ⅰ方法的还原性问题,分析了三Ⅰ方法的支持度理论,给出了一般化的-α三Ⅰ方
学位
初中(JHS)学生选择就读高中(SHS)的过程是加纳学生和家长们日常生活中的一个重要现象。选择学校的过程标志着计算机择校与安置系统(CSSPS)的重要一步。申请者必须从836所高中中选出4所。对这些申请人来说,最大的困难是获取必要的信息(如可用的课程、可用的住宿类型、WASSCE通过率、地点和地址),以便在其他方面提高他们的决策能力。  本论文的整体目标是提出一套方法,并在此基础上开发一个合作答疑
随着移动互联网和智能设备的迅速发展,二维码图像在人们日常生活、商业活动等方面占据了非常重要的角色。然而,在图像获取的过程中,往往会受诸多因素的影响,造成图像的细节、关键信息的丢失。图像复原技术就是为了改善图像质量而提出的。图像复原作为典型的病态反问题,其未知量过多,难以得到稳定可靠的解,因而目前的复原算法通常利用退化系统中的一些假设或先验知识作为求解模型的约束,通过最小化目标函数来求解最优近似解,