网页去重在基于Web企业竞争情报平台中的应用与研究

来源 :云南民族大学学报(自然科学版) | 被引量 : 0次 | 上传用户:cg120900230
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网上大量重复网页的存在,严重地影响信息的检索质量.因此提出了一种基于特征码散列的网页去重算法,利用特征码对特征语句集散列以缩小其比较的范围,提高了网页去重的准确性.实验表明该算法准确率高,性能良好,基于上述算法实现了基于Web的企业情报竞争平台中的网页去重.
其他文献
经推导获得了基于椭球坐标系的电介质,椭球体内极化场强方向与外电场方向之间夹角大小的表达式,对其进行了数值计算,认为对于椭球体而言其体内的极化场强方向并不一定严格和外电
提出了一种新的键参数拓扑指数^mL.用^0L和^1L与46种金属卤化物的标准熵关联,拟合的回归方程的相关系数R=0.984.结果表明,^mL具有良好的结构选择性和性质相关性,预测取得较好结果.
用原子吸收、原子荧光光谱法测定灵芝中铅、镉、砷、汞的含量,取得了较满意的效果,新方法的加样回收率在98~110%,精密度(RSD)小于3.0%.与传统的比色法相比,新法灵敏度高、重
从半环同态的角度出发,给出了半模的一个等价定义.
随着中国加入WTO日程日益迫近,城市市政建设和文化建设的步伐加快,人们对居住环境的要求越来越高,掀起一股欧式化装饰潮流,这充分反映出现代人的审美和对建筑外装饰的品味追