论文部分内容阅读
P2P文件共享系统已经成为当今互联网上流量最大的应用之一,如文件资源共享、存储共享、服务共享及协同计算、协同处理,到即时通信(腾讯QQ)、流媒体应用等。P2P网络的应用技术已经在互联网中无处不在。该网络中的文件是分布式存储的。eMule网络是P2P网络中最重要的一种。由于eMule网络越来越重要的地位,其网络的安全性,共享资源的知识产权侵权,色情,病毒传播等问题也越来越突出,eMule网络本身的特点又决定了这些问题难于防控,所以对eMule网络节点资源进行探测分析,总结出节点分布以及共享资源分布规律情况,建立相关分布模型系统,形成对eMule网络环境的有效监控尤为重要。本文的重点在于通过与KAD网络交互获取节点地址,对节点地理位置分布进行统计,通过点对点的消息交互获取节点的共享资源信息,对eMule网络上的常在线节点的资源共享内容进行深入的分析和统计,对共享文件大小,共享文件类型的种类,哪些文件共享率最高等等进行统计,建立相关的数据集,测量平台长时间运行保证得到的抽样数据能够最真实的反映出eMule网络的节点资源概况,为以后进一步的研究做下铺垫。为完成大规模,长时间的数据取样采集,本文所做的研究工作大致如下:(1)eMule网络主动测量的研究结合国内外的P2P网络测量实例,建立自己的测量方案,重点是建立自己的高效率的爬行器,用爬行器E-Crawler与KAD网络交互,获取节点信息,还通过KAD网络将自己拥有的热门资源发布出去,让其它节点来连接我们平台,这种主动的方式能保证快速,大量的连接上活跃的节点,能最真实的获取网络中的数据。(2)测量平台的搭建搭建一个基于eMule协议的网络测量平台,该平台能够较稳定的,高效率的在真实的Internet网络中对节点资源信息进行采集。(3)采集后的数据的展示和分析本文主要对以下几个方面数据进行分析:1.节点的地理位置分析。2.节点的客户端版本分析。3.节点共享资源的分析,如单个文件大小,类型,文件副本数,共享文件数目及节点共享资源总大小。