互联网上基于粗糙集的不良文本信息监控关键技术研究及实现

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:cxb632552353
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网信息技术的发展,各种色情、反动等不良信息在网上广泛传播,严重影响人类生活的健康品质,甚至威胁到国家的安定团结、社会的稳步发展。国家863计划“网上信息安全总和分析与监控系统”课题主要研究内容是如何对互联网上的不良信息进行监控、过滤等,确保网络内容安全。论文分析比较了空间向量距离(VSM)过滤器、贝叶斯(Bayes)过滤器以及K最近邻居(KNN)过滤器的性能,并针对论文研究目标,确定选择了空间向量距离(VSM)过滤器;在上述研究结果的基础上,结合利用粗糙集理论,提出了一个有效的网上不良文本过滤方法。实验结果表明了上述方法的有效性。主要研究内容如下: 首先,介绍了我国互联网所面临的问题,阐明了研究背景和意义,论述了互联网信息健康的必要性。 其次,研究了互联网上网页内容的抽取,对其进行了实验和分析。并介绍了常见的汉字编码。 再次,介绍了当前网络文本信息监控的方法,在信息处理方向上,文本的表示主要采用向量空间模型,给出了权重的计算方法和文本分类的几种算法。 接着,初步介绍了粗糙集理论,知识的分类,主要讲解了决策表的离散化以及在保持分类条件不变的情况下,决策表的属性约简和值约简,并给出了算法。 然后,讲述粗糙集理论在互联网上不良信息监控过滤中的应用与实现。给出粗糙集处理网页的流程,给出过滤系统模块的框架,对处理流程进行分析,最后给出该系统的处理实验结果。 最后,对本文所做的主要工作进行了总结和展望。
其他文献
JVT/H.264是ITU-T VCEG组织和ISO/IEC MPEG组织共同研究的新型视频压缩标准,是目前图象通信研究领域的热点问题之一。作为视频编解码领域的最新标准,H.264具有数据压缩率高、抗
现代战争是高科技的信息战,如何准确及时地获取信息将是制胜的重要因素。人类通过感知器官获取的信息中,图像信息占据了信息总量的60%以上,图像信息具有十分重要的军事价值,图像侦
群盲签名方案具有群签名和盲签名的特点,在电子商务、电子政务、网上选举和投标等场合都有重要的应用。本论文以G.Ateniese和J.Camenisch基于离散对数问题的能抗合谋攻击的群
随着Internet的迅速发展和应用,信息的安全问题日益突出。信息隐藏技术是信息安全的一个重要方面,随着科学技术的发展,信息隐藏已经逐渐成为一门独立的学科,其研究范围也不断扩
空时分组码(Space-TimeBlockCodeSTBC)是近年来发展起来的一种新的编码方法。STBC的一个显著的特点是各天线发射的信号之间正交,这不仅能够保证在平坦的慢衰落信道下获得最大
学位
本文研制的“数据采集控制系统”是落锤式弯沉仪路面检测系统的重要组成部分,它通过液压系统控制重锤从一定高度自由落下对路面施加一冲击荷载,同时利用沿荷载轴线分布的传感
随着航空航天技术的飞速发展,合成孔径雷达(SAR)不仅广泛的应用在军事上,而且在农业,地理,海洋,气象等领域也有广泛的应用。但是由于SAR是干涉成像,实测得到的图像几乎被speckle噪声
本文在解决互联网图像内容安全问题的现状,创新图像隐写检测技术的方法,所属课题组依托国家863计划重大项目“网上信息安全综合分析与监控”(2003AA14216)并研发了实时、高效的图
无线个人网是一种新兴的短距离、自组织无线通信网络。近年来,根据其组网灵活、功耗低和可与现有网络共存等特点,无线个人网在家庭、医疗以及办公环境中的应用前景十分广阔;并由