用于中文色情文本过滤的近邻法构造算法

来源 :上海交通大学学报 | 被引量 : 0次 | 上传用户:GISSeven
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
从不良信息中最为普及的中文色情文本过滤入手,用近邻法(KNN)算法构造对比了4种特征项选择的方法在中文色情文本中的应用,它们分别是字、词、标点符号和词性等特征.试验表明,中文色情文本不同特征项的选择对中文色情文本的分类效果起到了重要的作用.实验同时表明,所设计的过滤器在保证速度的前提下,很好地完成了基于内容的高精度过滤.
其他文献
本文以二甲苯为溶剂,以月桂酸和二乙烯三胺为原料,月桂酸与二乙烯三胺的摩尔比为1:1.5,在150~220℃发生酰胺化及环化脱水反应5 h,得浅黄色透明月桂酸咪唑啉,将月桂酸咪唑啉与
介绍了分数微积分定义,并运用拉普拉斯变换法证明了分数阶线性常微分方程解的存在性和唯一性,并给出了其传递函数描述和状态方程描述.提出了分数阶线性常微分方程的两种求解
针对柔性装配系统复杂的并行作业特点,提出了规则嵌入赋色Petri(RCP)网模型.给出RCP的定义,利用面向对象的语言实现了网的静态描述以及动态运行,在此基础上得到了相关的系统
In this paper, the cutting process of a metal block is numerically simulated by the dynamic explicit FE code ABAQUS. Taking thermo-mechanical coupling effect in
基于离散序列小波变换和主元分析,对低信噪比的神经元锋电位信号提出了新的分类方法.通过对原始信号进行尖峰检测,获得尖峰信号样本,对每个样本进行离散序列小波变换之后,再
财务管理是商品经济条件下企业最基本的管理活动。在现代市场经济社会中,企业生产经营规模不断扩大,经济关系日趋复杂,竞争也日趋激烈,财务管理更成为企业生存和发展的重要环节。
针对具有时滞的双重积分对象,提出了两种新颖的二自由度控制结构.对于给定点跟踪控制器:一个是采用鲁棒H2最优控制性能指标设计;另一个是采用常规的微分控制器,它们均在对象
通过有限元分析软件结构分析模块在'神威Ⅰ'超级计算机上的并行化二次开发,把商用有限元软件强大的前后处理能力与超级计算机的高性能计算能力结合起来,扩大了分析规
将学习控制应用于高精密快速伺服注塑机成型过程,根据成型过程的特点设计了一个预测迭代学习控制器,并利用先前得到的系统模型对算法进行仿真.控制器由前馈和反馈控制两部分