论文部分内容阅读
随着我国教育信息化的深层次推进,互联网中的教育信息资源大量增长。海量的网络教育资源既为教育带来了强大的助力,也为教育资源的建设与管理带来了新的挑战。当前我国教育资源的管理和建设存在各自为政、重复建设、质量参差不齐等问题。如何将现有资源整合起来,更加有效地管理和利用,是当前研究的一个重点。有专家提出通过建立教育资源共享网格的方式解决上述问题。网格技术的诞生最初是为了解决高性能计算和数据密集型应用的需求。教育资源共享网格是数据密集型网格的一种新的应用方式。在这种类型的网格中,如何有效地管理数据使得位于不同地理位置的用户都能够高效访问是一项巨大的挑战。数据复制技术为此提供了解决方案——采用适当的数据复制策略能够有效降低访问延迟和带宽消耗,还有助于负载的平衡,提高系统的可靠性。作者通过查阅大量的文献资料,结合自己的研究分析,发现当前数据网格复制策略大都是针对普遍意义下的数据网格,对于教育资源共享网格不适用。因此,本文在对当前数据网格复制策略研究的基础上,对教育资源共享网格的数据复制技术进行了探索,设计出了适合教育资源共享网格的基于文件内容的数据复制策略。本文从网格结构、副本创建、副本替换和副本选择四个方面介绍该策略。该策略采用了基于P2P结构的域集中管理的网格结构,网格被划分为若干区域,区域间的网络带宽较小,区域内带宽较大,且每个域中都有一个中心节点用于记录本域内文件的存储情况以合理分配域中的存储资源。该策略进行副本创建和副本替换的依据是文件的用户兴趣度,即用户对文件内容感兴趣的程度。本文引入教育学中的知识点概念来表示文件的内容,并且通过文件的访问记录预测文件内容的用户兴趣度。对于没有被访问过的文件,则采用计算文件内容相关度的方式寻找与它内容最接近的被访问过的文件,本文认为这两个内容最接近的文件具有相同的用户兴趣度。另外,为了达到优化教育资源、优胜劣汰的目的,本文还设计了用户满意度评价功能,记录用户对访问过的文件的评分,这些评分记录显示了用户对文件满意度的趋势,是其它网格节点在本地创建该文件时的参考依据。该策略在副本选择上采用了投标的方式,使网格节点能够以最小代价获得想要的数据副本。为了验证本文所提出的策略的可行性,本文使用网格模拟工具OptorSim进行了模拟实验,证明了该策略能够较为准确地预测用户的访问热点,并且比其它复制策略更加适合教育资源共享网格。