语义Web使用挖掘研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:jjandrew1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Web技术的快速发展及广泛应用,Internet上的Web页面数目开始呈指数级的速度增长,如何结合语义知识来挖掘分析用户对Web页面的访问行为成为一个重要的研究方向。这里分别从用户的Web使用日志信息和Web页面内容信息着手,从语义距离计算、语义挖掘算法和结果序列的语义相似度分析这三个方面展开研究。在语义距离计算方面,在已有的计算方法的基础上加入页面在日志数据中的出现概率信息,由页面在本体层次树中的深度、分支度和出现概率这三个因素共同决定结点页面的语义权值,进而得到任意两个页面间的语义距离信息。实验表明,改进后的语义权值计算方法得到的结果更加合理和全面。在语义挖掘算法方面,结合Mabroukeh提出的使用语义距离来辅助挖掘的理论思想,考虑到日志数据中访问时间的有序性,以吴海燕提出的AprioriAll算法的连接条件为基础,加入改进后计算得到的语义距离信息,即在算法的连接步中除了要满足已有的连接条件外还需要考虑两个连接页面的语义距离,如果大于给定的语义距离值,则不再执行连接操作。实验表明,改进后的算法挖掘得到的频繁语义访问序列具有一定的语义相关性,算法的计算规模和执行时间也得到了一定程度的改善。在结果序列的语义相似度分析方面,结合本体和本体映射的相关理论,给出一种新的页面本体的定义形式,以页面前导符的形式按照页面内容关键词信息将所有的页面统一组织,通过对比前导符、关键词及其他本体因素的相似度来综合得到页面内容的语义相似程度,以此来对挖掘得到的访问序列进行语义相似度的分析。
其他文献
随着信息时代的发展,海量数据的存储传输成为目前必须解决的一个重要问题。云存储为海量数据的存储提供了很好的解决方案,但是缺乏标准化的云存储应用程序编程接口,极大的限制了
快速造字软件是一种汉字编辑软件,其功能主要包括字库文件加密解密,字体部件提取,替换搜索,字体拼合,字体编辑,汉字骨架线提取,交叉笔画的十字分割,以及所有字的大盘显示等功能。  
随着经济发展和社会的不断进步,桥梁数量蓬勃发展,越来越多的各种类型的桥梁被修建起来。然而,桥梁安全事故也越来越多,在设计、施工、运营阶段,桥梁面临着各种不安全因素,不断威胁
传统的单核处理器受到功耗、漏电量和电磁干扰的影响,性能提升已成为瓶颈。为了提高处理器的整体性能,多核处理器逐渐取代单核处理器,在保持工作频率的条件下,降低了处理器的平均
随着数字技术与多媒体技术的发展,音乐情感语义的识别已经成为多媒体检索中的一个重要研究方向。目前,大多数针对音乐情感的研究,都局限于将一首完整的音乐分到一种情感类别当中
移动互联网的飞速发展改变了人们的生活方式使得人类进跨入一个全新的信息时代。作为这个时代的主题,图片、文字、音频、视频、数据等多媒体通信相结合,极大丰富了人们的生活体
多学科虚拟实验支撑平台(VeePalms)是一个采用Modelica语言实现的统一仿真建模平台,其前后台交互仿真机制是基于Modelica仿真求解器OMC(OpenModelicaCompiler)实现的。为了保证任
随着城市化快速发展,越来越多的人群现象出现在公共场所,为更好的对公共区域进行管理,人群异常事件检测一直受到社会和政府的重点关注。然而,现有的研究的人群异常事件检测方法大
目前互联网上出现了大量构件库和零散的构件资源,但是,这些构件资源呈现部分集中、总体分散的特点,以及各个构件库对构件信息的描述存在差异,导致用户很难快速准确的检索到所需的
兼顾信息的保密性和访问便捷性一直是密文检索领域试图达到的目标,其实现与优化也是一个循序渐进的过程。当前已有的密文检索方案都将检索操作本身作为重点,没有考虑多个密文拥