基于贝叶斯网络分类器的Web内容过滤系统研究与实现

来源 :东南大学 | 被引量 : 0次 | 上传用户:dsb5519
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Web内容过滤系统作为重要网络信息安全设施,通过对Web内容信息进行识别过滤,使得有害Web信息不能进入受保护的网络,在保护青少年身心健康和净化网络环境方面起了积极作用。 贝叶斯网络具有概率表达能力强、增量学习特性好等优点,但其结构复杂,构造难度大,难以在实际应用。BM-IF是一个简化了的贝叶斯网络模型,在保留了贝叶斯网络表达能力的基础上,大大简化了网络结构。 使用简化贝叶斯网络分类模型作为分类器,Web内容过滤系统能在运行过程中不断进行学习,具有较强主动学习能力和主动适应能力,同时简化贝叶斯网络模型可以结合专家知识和学习知识,让本系统的用户方便灵活的定义自己的过滤类别。 本文针对以往Web内容过滤系统准确率低、覆盖率低,用户维护困难等缺点,提出了根据Web数据挖掘思想建立的贝叶斯网络分类模型。这一模型充分利用了Web内容信息、Web链接信息、Web使用信息进行分类,通过对大量上述三类信息的学习,不断提高分类决策的性能。 本文还对分类影响较大的一个因素——关键词选择及分类词频统计进行了探讨,并在前人的研究基础上,使用双向扫描分词法结合歧义字段校正的算法对学习语料进行分词和统计,根据对学习语料的词汇统计选取关键词。
其他文献
随着网络技术的飞速发展,互联网在社会各个领域已经逐渐得到普及,其应用越来越广泛,特别是在计算机的协同工作中发挥的潜力巨大。P2P网络为“非中心化”网络,它将整个因特网
破损图像的修补一直是图像处理中一个重要的研究课题,数字图像修补技术被广泛用于各个领域包括医学图像的修复,文物的修复,犯罪现场的还原以及电影胶片上划痕,污迹的消除。在
基于局域网的文件分布式存储系统是一种P2P架构的存储模型,通过有效利用网络的带宽、存储能力和计算资源来提供一个持久性的存储基础结构。本系统将文件进行冗余分片后分布存
  移动IPv6(MobileInternetProtocolVersion6,MIPv6)是利用下一代IP技术进行无线通信的网络协议,将在下一代无线网络被广泛使用。在移动IPv6的环境下,移动用户对服务质量保证(
本文在软件复用和领域工程己有的研究成果基础上,在Office办公软件系统领域中,使用了基于特征的领域分析方法,用XML语言对特征模型进行了形式化的描述,由特征抽取软件构件,由
事务处理技术是保证信息可靠性和一致性的关键技术。目前广泛使用的平面事务是具有ACID(atomicity, consistency, isolation and durability)特性的原子操作序列。平面事务模
互联网是信息共享史上的里程碑。但是Web网页的持续增长和其固有的特性阻碍了人们高效地共享。为了克服这些缺点,计算机工作者致力于发展下一代互联网。他们的工作主要包括两
  本文综合叙述了已有的基于程序语言设计的软件安全研究。按照对安全性质推理方法的不同,将这类研究分成基于Hoare逻辑和基于类型系统两类。这两种方法在表达能力和推断自
图像分形压缩的原理是利用图像中的局部自相似性来构造局部迭代函数系统。分形压缩的解码图像质量、压缩比和编码速度取决于子块的大小,取的块越大压缩比越高、编码越块、解
人脸识别现在应用于安全部门、电视会议、身份鉴别、数字监控等领域。与其它生物特征识别技术相比,人脸识别技术有着广泛的应用前景,特别是在可用性、可操作性等方面,人脸识