基于B2B垂直搜索的网页信息抽取系统研究

来源 :计算机技术与发展 | 被引量 : 0次 | 上传用户:bing4086
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了解决从网页中准确抽取产品信息这-B2B垂直搜索引擎的关键问题,以站点树为模型,首先分析了企业网站的结构特征,在此基础上构建了一个面向B2B垂直搜索引擎的网页信息抽取系统。该系统利用站点树在企业站点大量网页中识别出产品页,并进行去噪处理,然后使用基于规则的方法抽取产品页中包含的产品描述信息和参数信息。通过该系统抽取到的各类产品信息较为准确’,且效率得到明显提高,适用于B2B垂直搜索引擎中对产品的描述、分类及搜索。
其他文献
图像窗口模式匹配前常需进行灰度分布标准化预处理,但由于某些模式识别场合需要掩去图像窗口的一些无关区域,常见的灰度分布标准化处理快速算法不适用。应用广义积分图像,实现了一种任意掩膜的图像窗口灰度分布标准化快速算法。掩膜的形状具有对称性时,算法的计算速度还可进一步提高。实验表明,该算法能提高掩膜图像窗口灰度均值、方差的计算速度1倍以上,可实现多尺度目标检测中对大量掩膜图像窗口的快速灰度分布标准化处理。
化学探索性实验的教学过程设计是搞好化学探索性实验的难点之一。文章结合教学实践,讨论了实验过程中几个环节的教学方法及注意事项,并绘制了化学探索性实验教学过程流程图。
为了提高对医院监护中心历史数据的管理水平,为监护人员提供有力的决策支持,提出了一种针对该系统的改进Apriori算法。该算法引入了属性值度的概念,减少了找出频繁项集所需要的
传统的移动网络的各个产品大多是独立开发的,没有统一的硬软件开发平台,而全IP的多业务集成开发通信平台可避免各模块独立开发存在的重复劳动。给出了一种适用于通信领域的基于
在日益重视现场科学观测和考察研究的海洋科学发展的现阶段,建立海上观测可移动共享平台,设置基于长期观测的开放航次,在海洋环境观测、生物资源调查和工程勘测方面具有独到之处。
通过对文献资料的综合比较,结合自身研究成果,对我国高校教学实验室的发展与现状进行了分析研究,提出奠基阶段、滞留阶段、恢复阶段和飞跃阶段4个发展阶段及其特点,为高校教学实
随着社会信息化进程的加快,基于计算机和网络的信息系统的应用日趋广泛,信息安全性问题日益突出。该文研究了信息系统安全性的概念和基本需求,在分析了旧有信息系统安全模型后提
从Blog概念入手,详细分析了Blog所具有的零基础、信息检索、时效性强和思想共享等特征,提出了Blog在现代教育技术中的信息过滤、师生交流平台、教师教学的新载体、学生信息处