群智感知网络数据收集与真值推断研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:szcbg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着智能移动终端的高速发展和迅速普及,群智感知作为新兴的感知模式利用内置有强大处理器和多种传感器的智能终端,完成传统无线传感网络难以处理的感知任务。群智感知网络因布设成本低、覆盖范围广、感知智能、移动性高等特点被广泛应用于环境监测、智能交通、位置服务等领域。群智感知网络最基本的两个问题是数据收集和真值推断。数据收集可以看成用户完成感知任务的过程,因此合理的任务分配至关重要。执行任务会消耗用户时间和设备资源,威胁用户隐私,理性用户不愿意无偿参与感知活动,激励机制是保证用户收集数据、维持系统持续运行的必要手段。由于群智感知网络让普通持有智能终端的用户感知数据,用户可靠度难以保证,收集数据包含有大量噪声。真值推断通过处理收集的数据,发现可靠的任务真值,提取有效的信息。目前针对群智感知网络的研究仍然缺乏对异质用户、多样任务以及时空因素的考量,从而无法实现有效激励用户收集高质量数据并进一步精准推断真值的目的。本文围绕群智感知网络的数据收集和真值推断这两个基本问题,充分考虑用户和任务的特性,研究高效的任务分配方案、合理的用户激励机制、安全的隐私保护策略和可靠的真值推断算法,系统地分析了群智感知网络数据收集和真值推断的各项关键问题和协同优化策略,并取得了如下主要成果:(1)位置隐私保护下的激励机制设计。现有激励机制在鼓励用户收集位置相关的数据时,难以保证用户位置隐私安全,严重阻碍用户参与感知活动。为此,本文设计了隐私保护的反向拍卖机制,在激励用户感知数据的同时,保护位置的k匿名隐私。隐私保护需要模糊和扰乱位置,从而引入了信息损失。为降低因k匿名保护致使的信息损失,本文提出了有效的位置聚合算法动态分组用户,不仅实现了k匿名位置隐私保护,而且显著降低了信息损失。考虑信息损失对数据质量的影响,反向拍卖机制有机地融合了位置聚合结果,激励用户收集高质量数据并降低平台开销,满足了真实性、个体理性和计算高效性。理论和实验分析表明,所提机制降低了信息损失的影响,保证了位置隐私安全,收集了大量、高质数据。(2)一致性事件推断与激励机制设计。已有群智感知网络收集实时数据时,难以保证数据准确性,缺乏针对不可靠用户的有效激励机制。为应对这一挑战,本文通过评估数据可靠度、激励用户真实上报数据进而推断可靠的一致性分类事件真值。考虑到影响数据准确性的各项关键因素,本文构建贝塔用户信誉体系,计算数据时空偏离因子,综合衡量数据可靠度。接着,基于数据可靠度,筛选出合格用户,并设计改进的贝叶斯推断和加权多数投票在线增量推断事件真值,降低了推断复杂度。为激励用户上报真实的数据,本文提出了同行预测算法,有效地计算用户激励报酬,保证了真实性、个体理性和公平性。本文所提框架不依赖于特定群智场景,因此具有可移植性和可扩展性。(3)在线位置感知的任务分配与真值推断。随时间的推进,用户不断地移动,任务动态地到来,然而已有工作缺乏考量用户和任务的时空特性,难以应用到实际场景。本文充分考虑时空因素的影响,综合研究位置感知的动态任务分配和真值推断。首先,为最优化任务分配的效用,本文提出了组合算法在离线情况下高效匹配用户和任务,得到了 APX-hard分配问题的常数级次优解。其次,本文分析在线任务分配,提出了扰动李雅普诺夫函数,克服了因用户移动带来的不连续覆盖问题。在每一时段,仅利用当前可得信息,设计了在线控制策略,不仅维持了系统的稳定,而且实现了 O(1/V)内的渐进最优时间平均感知效用。最后,针对数值任务真值推断,本文融合任务的空间相关性,构建了真值推断的优化框架,并采用块坐标下降法迭代求得收敛结果。本文综合研究了任务分配与真值推断,一方面降低了收集数据的随机性,另一方面提高了真值推断的准确率。(4)在线能力感知的任务分配与真值推断。针对实际群智系统的位置感知、信息动态和质量异质特性,本文探讨了数值任务和分类任务并存时的动态任务分配和真值推断问题。考虑到数值任务和分类任务的内在差异,本文合理地建立了用户能力向量模型。结合用户和任务的先验信息,提出概率图模型统一数值任务和分类任务的真值推断框架,并进一步设计无监督的最大似然估计和EM(Expectation Maximization)算法分别发现数值真值和分类真值,显著降低了推断误差。另一方面,本文分别从概率提高和熵值减少的角度,融合中间真值推断结果,设计动态任务分配策略,线性筛选用户-任务对,降低数据收集的不确定性,进而提高真值推断的准确性。真值推断算法能同时在线估测任务真值和用户能力,其中动态更新的用户能力进一步应用于任务分配,从而提高收集数据的质量,并反过来增进真值推断。
其他文献
问题:对于2型糖尿病患者,二甲双胍与安慰剂或其他降糖药物比较,其致死性和非致死性乳酸酸中毒的风险如何?二甲双胍会增加乳酸水平吗? Question: What are the risks of fata
利用经验正交函数分解(EOF)方法对1948—2004年全球对流层顶月平均气压场进行分析,讨论57 a来气压场的空间载荷向量场及其对应的标准化时间系数的演变,并且利用小波分析方法
人生又逢喜乐之大事——中华人民共和国成立70周年,按捺不住的心里话涌现不吐不快。出生于1959年的我,一直在国内接受爱国主义教育,简单而幸福的生活伴随着我的成长,但同时饱
白杨素是一种由紫葳科千张纸属植物木蝴蝶中提取出来的黄酮类化合物,由于5位、7位连有羟基,因此又叫5,7-二羟基黄酮。白杨素具有非常广泛的生物学活性,其在抗氧化、抗病毒、
近年来研究以爆炸冲击等强动荷载为主要荷载形式的流固耦合问题受到日益关注,其在反恐和军工领域具有非常重要的实际意义。本文对强气动荷载作用下流固耦合问题进行了阐述,详
文章分析了工程施工安全管理现状,探索将BIM技术应用到施工安全信息化管理中,基于BIM二次开发对施工现场展示类危险源进行实时控制,优化场地布置,组织三维技术交底,开展安全
本论文所研究的“秦刻石”之“秦”,是指公元前221年秦始皇统一六国后的秦朝,而“秦刻石”则是秦始皇二十八年巡游至泰山、琅琊台所遗留至今的泰山刻石,琅琊台刻石,并主要将此二者与后世的峄山刻石(长安本)一起比较。本论文的主要内容如下:引言介绍了研究目的、意义、范围和方法,然后对相关研究进行了回顾和综述。第一章叙述了先秦篆书的概况,秦刻石的产生因素以及秦刻石篆书的概况,通过梳理这些材料来综观秦刻石对战国
从1946年2月14日,第一台计算机ENIAC(阿尼埃克)的问世,到以Internet为代表的互联网的诞生,计算机技术加速了世界各国全球一体化的进程,也给人们的工作和生活方式带来了前所未
钢结构作为实际工程中不可代替的重要结构构件,它的损伤会给工程带来重大的安全隐患及经济损失,因此对钢结构进行损伤识别及研究具有重大意义。在结构健康监测领域内,无损检
通过 196 1~ 1998年江苏省 11个站点 7月~ 8月平均气温与 12月~次年 1月平均气温之差值场时间序列的 EOF分析 ,探讨江苏省气温年较差异常的演变特征 ,并在此基础上利用合成分析