论文部分内容阅读
正像传统搜索技术在互联网上扮演的重要角色一般,物联网搜索技术作为基础性服务也将成为物联网应用不可或缺的一部分。对于物联网搜索来说,由于传感器感知的实体状态动态变化,能够在物理世界中实时搜寻指定状态的实体变得十分困难。如何在大量传感器存在且各传感器状态动态变化的情况下,减少搜索引擎访问传感器的数量,增加搜索引擎访问传感器的正确性,高效且低时延地返回匹配用户查询状态的传感器集合,是本文要解决的首要问题。本文中利用数据挖掘中的一种周期模式挖掘算法,结合人们在日常生活中表现出来的行为规律性,提出了基于预测模型的传感器排序算法,它有效地实现了基于传感器状态的搜索。排序算法的基本思想是通过传感器输出状态的历史数据计算出经过排序的传感器列表,列表中传感器排名越高,那么它越有可能匹配用户提出的查询,以此为搜索引擎提供处理优先级,将资源使用在最有可能匹配查询的传感器上。这些资源是通过网络读取传感器当前值以检查它是否匹配查询的开销。若没有传感器的预先排名,搜索引擎可能需要访问大量的传感器才能返回结果,这会产生巨大的时延。本文利用网上教室预订系统的数据集以及办公楼内移动监测传感器的数据集,统计传感器排序列表中的排序错误率,比较了不对数据集采用预测模型和对数据集采用预测模型两种情况下的排序错误率,验证了传感器排名算法中单周期预测模型和多周期预测模型的适用场景和优势。此外,准确地表示出预测模型并且使之与现有的搜索引擎进行整合,是本文接下来要解决的一个难题。基于目前web的发展以及语义传感器网络本体的成熟,本文利用资源描述框架(Resource Description Framework,RDF)和SPARQL查询语言(Simple Protocol and RDF Query Language,SPARQL),以及支持这些技术的开源框架Jena和ARQ,对基本预测模型进行了语义描述。在基本语义预测模型中采用给模块累加因素的方法,逐步加入时间、地点以及关系等因素完善模型,最后完成了一个简单易用的传感器查询系统,用户通过指定时间、地点、传感器状态获得满足查询条件的传感器集合。