基于无监督特征选择的聚类分析及应用研究

来源 :辽宁师范大学 | 被引量 : 0次 | 上传用户:wdtt5200
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
移动互联网、社交媒体等新兴科技的广泛应用,产生了海量蕴含着丰富社会信息和经济价值的媒体数据。这些数据类型多样、更新速度快、时效性强以及价值密度低的特点,极大推动了各个领域对文本、图像、视频、音频等媒体数据处理的需求。因此,准确而高效的处理媒体数据对学术研究和经济预测意义重大。本文主要以网络社交数据和移动通讯数据作为研究对象,对动态数据流进行无监督特征选择的聚类分析及应用研究,主要工作如下:1、基于用户相关性的动态网络媒体数据无监督特征选择算法(UFSDUC)。首先,对社交网络中相互交互的用户进行关系分类,作为无监督特征选择的约束条件。然后,利用拉普拉斯算子构建用户相关性的特征选择模型,量化相关用户之间的关系强弱,根据拉格朗日乘子法数学化特征模型中最优用户关系。最后,基于梯度下降法设定动态网络媒体数据的阈值,用以计算非零特征权值来更新最优特征子集,进而达到对数据进行有效分类的目的。该算法可在保证用户相关性完整的基础上对动态网络媒体数据进行准确、实时的特征选择。2、利用不完整数据检测交通异常的方法(TAD)。首先,根据实时手机数据与车辆密度之间的相关性进行聚类分析,提高了不完整数据的计算效率。然后,利用手机呼叫量变化率的波动情况检测分散式的动态事件,即时捕捉道路异常。最后,通过对异常事件发展轨迹的追踪,获取异常分布路线,进而推算影响区域并采取有效的监管措施。实验结果表明,该方法可以有效提高交通异常事件的检测效率,具有一定的创新性。媒体数据传播逐步向着超大化、动态化、高维化的方向发展,采用特征选择和聚类分析可以获取隐藏在数据内部的价值信息,提高特征提取与聚类计算的速度和准确度。本文的两个研究方案对媒体数据研究提出了新颖的解决思路,能够缓解计算速度与准确度之间的矛盾。
其他文献
介绍了铸造铝合金的特点以及在汽车发动机缸盖中的应用;分析了高强度铝合金缸盖各部位的加工精度,并指出其加工特点和难点;详细介绍了几种铸造铝合金加工刀具,并分析其匹配性
曲轴-轴承系统是内燃机的关键部件,其摩擦学、动力学性能直接影响到内燃机工作的可靠性和耐久性,对其进行流体动力润滑和弹性流体动力润滑研究具有重要的意义。本文从流体动
<正>党委中心组学习是各级领导班子和领导干部在职学习的重要组织形式,是加强思想政治建设,提高理论素质和执政能力的有效途径,在学习型党组织建设中具有至关重要的领学和示
讨论了由有机伯胺或仲胺和CS2合成二硫代氨基甲酸盐DTC的反应及副反应,简介了合成工艺。根据红外光谱确认了由三乙烯四胺合成的二硫代氨基甲酸盐(以下简称DTC)的结构。以含原油
尝试利用所建立的实验室尺度沉积物生成仿真装置模拟不同壁面温度下的喷嘴沉积物生成过程,并用傅里叶转换红外线光谱仪(FTIR)分析沉积物生成的化学机理,探讨汽油中组成物质与
随着又一批消防产品纳入强制性认证管理,目前,纳入CCC目录的消防产品累计已达15类(种),基本涵盖了具备认证实施条件的消防产品。消防产品的监督管理和执法查处,成为地方认证监
随着我国建筑事业的高速发展,其安全管理问题也越来越引起人们的高度重视。对房屋建筑施工安全管理的重要性及存在的问题进行了分析,并由此提出了相应的解决措施。
排气系统设计是否合理对柴油机的性能有着重要影响,为了探求某型增压柴油机采用不同排气系统的优越性,本文以内燃机性能仿真软件GT-Power为平台,建立了工作过程仿真模型,利用
本文阐述了关系妄想的精神病理学发生机制及认知模型,认为关系妄想的精神病理学发生机制可能是"自我参照效应"。