网页分块相关硕士博士期刊学术论文

网页分块相关论文

Web全文信息检索系统的研究与实现

随着网络的发展和Web资源的丰富,利用Web全文信息检索系统来获取所需信息已经成为人们日常生活的重要组成部分,用户也越来越关注如......

学位

Web信息检索网页分块 DOM 在线聚类

基于视觉信息的上下文广告关键词提取算法研究

互联网已经成为目前最为重要的广告媒介之一，它能够以低成本将商品和服务向全世界的各个角落展示，这种独特能力吸引了众多的网络广告......

学位

上下文广告网页分块统计语言模型视觉特征关键字提取

垂直搜索引擎主题特征提取及相关度算法研究

搜索引擎是人们获取海量网络信息的首要工具,是网络研究和应用的关键内容。目前随着Internet信息的爆炸增长以及信息多元化的发展,......

学位

垂直搜索引擎主题特征提取相关度 IVSM V-Page-Rank 分块主题爬行

基于网页分块的论坛爬虫关键技术研究

伴随着Web2.0技术的发展,作为一种典型的用户创建内容的应用,网络论坛在全世界非常流行。每天有无数个针对能够想象到的所有话题或......

学位

WEB爬虫论坛页面分块爬行策略文档结构模型

Web新闻内容抽取的研究与实现

互连网上的信息，很大一部分是以新闻的形式提供给用户的，Web新闻内容抽取的研究，可以帮助用户迅速地从海量互连网信息中获取想要的信......

学位

数据挖掘信息抽取网页分块机器学习决策树算法

基于网页分块的主题搜索引擎的研究与实现

搜索引擎解决了网上查找信息难的问题。随着网络信息指数级增长以及行业分工不断加大,针对专业领域的信息搜索在精度和深度方面要......

学位

主题搜索引擎网页分块 CTVPS 主题提取 Nutch Search Smart

基于页面分块和链接分析的Web图片检索研究

21世纪是网络的世纪,网络已经完全融入了人们的学习、工作和生活。随着Internet技术的高速发展,Web已经成为人们获取信息的一个重......

学位

Web标准网页分块链接分析 Web图片检索

基于网页分块的Web信息抽取的研究与应用

Web内容越来越丰富、复杂，在面对精确的、个性化的用户需求，与移动设备小屏幕不能显示有太多内容的网页，传统地把整个页面作为一个基......

学位

Web信息抽取网页分块 Xquery查询信息处理

基于网页分块思想的搜索引擎索引系统

现有的搜索引擎都是对整个页面建立索引并用于检索的,但某些页面中可能包含不同的主题块,如果用户提交的多个关键词恰好分别位于不......

学位

网页分块索引系统分类搜索引擎

主题网络爬虫的研究与实现

随着互联网资源的迅速增长和信息环境的日益复杂，追求高网络覆盖率的通用搜索引擎己无法满足用户更专业更精确的查询需求，因此，面向主......

学位

主题爬虫特征选择 PageRank算法网页分块主题预测

基于页面分块的网页内容提取的研究与实现

随着互联网时代的来临,Web已经成为世界上最大的信息源,给人们生活带来了极大的方便。但是Web在给人们提供丰富信息的同时,又使人......

学位

主题型网页网页分块内容提取语义块

基于网页分块的主题爬虫方法研究

随着网络上信息的爆炸式增长,普通搜索引擎的查询结果越来越不能满足用户查询的需要,尤其是那些查询特定信息的不同领域、不同背景......

学位

主题爬虫隧道分类器网页分块类间转移概率

垂直搜索引擎中主题爬行技术的研究

随着互联网技术的飞速发展，传统的通用搜索引擎逐渐暴露出了覆盖率低、结果不准确等弊端。为了满足用户精确搜索的需求，垂直搜索引擎......

学位

主题爬行维基百科主题描述网页分块自适应方法

基于改进TCD图像检索和分类的钓鱼检测模型的研究

钓鱼网站检测已经形成钓鱼攻击和钓鱼检测相互博弈的局面。钓鱼检测的方向和技术因为钓鱼攻击技术的不断升级,需要寻求新的角度。......

学位

钓鱼检测视觉行为 TCD算子网页分块网页重构 PLSA MapReduce

面向移动设备的Web自适应代理系统研究与实现

随着智能手机和移动设备的普及,移动用户对于手机浏览和阅读的需求不断增加,移动化已成为一个不可避免的趋势。与此同时,原有的面......

学位

自适应移动设备脚本指令网页分块

基于网页分块的Web信息抽取技术研究

随着互联网技术的飞速发展,Web信息呈现出指数级的增长,WWW中蕴含了海量的信息可供我们利用。但是,人们想要获取一条需要的信息就......

学位

网页分块 Web信息抽取信息搜索 Web数据挖掘搜索引擎 VIPS算法

基于本体的Web信息抽取

近年来，伴随着互联网的快速发展产生了海量的信息，Web页面呈现多样性和异构性等特点。此外，目前的Web页面结构比较复杂，在同一个页面上......

学位

结构化网页分块 Web信息抽取领域本体自适应

基于网页分块的科技信息采集系统的设计与实现

本文针对目前互联网上科技信息需要定向追踪的需求，利用基于Web的信息采集技术，设计科技信息采集系统的系统框架，并对其中的网页分块......

期刊

信息采集网页分块数据消重 information collection page segmentation data elimination

一种基于语义的Web挖掘方法研究

在已有的基于Dom—Tree的网页信息提取算法基础上，通过对Html标签进行分类，逐个分析各Html标签所包含的结构信息，设计了一种自底向上......

期刊

语义WEB WEB挖掘网页分块

基于视觉的Web页面分块算法的改进与实现

基于视觉的Web页面分块算法（Vision-based Page Segmentation Algorithm）作为网页分块技术重要的一部分，得到了广泛的应用，然而由于网......

期刊

VIPS 网页分块 TABLE 标签树 CTVPS

Web信息采集中页面分块技术的研究

本文提出了一个基于网页分块的信息采集系统模型。在页面分析阶段，引入了改进的基于视觉的页面分块方法，这是一种自顶向下的、标签树......

期刊

信息采集网页分块噪音

基于CRFs的新闻网页主题内容自动抽取方法

针对当前新闻网页主题内容抽取方法较少利用网页块之间关联特性这一问题,提出了一种基于条件随机场（CRFs）的新闻网页主题内容自动抽......

期刊

WEB信息抽取条件随机场网页分块 Web information extraction conditional random fields Web pa

面向主题爬取的多粒度URLs优先级计算方法

垂直检索系统中主题爬虫的性能对整个系统至关重要。在设计主题爬虫时需要解决两个问题：一是计算当前页面与给定主题的相关度,二是......

期刊

计算机应用中文信息处理主题爬取优先级计算网页分块相关度计算 computer application Chinese information pro

基于分块的网页主题信息自动提取算法

对互联网上大量存在的基于模板的网页,根据其半结构化的特点,提出了一种网页分块和主题信息自动提取算法.该算法利用网页标记对网......

期刊

网页分块主题信息自动提取特征选择网页分类 Web-page segmentation topic content information automat

基于网页分块思想的PageRank算法研究与优化

PageRank是一种典型的搜索结果排序算法。本文首先分析了PageRank算法的工作原理及网页分块的基本思想;然后研究了一种基于VIPS分......

期刊

网页分块 VIPS算法链接分析 PAGERANK算法

基于分块的网页主题文本抽取

根据网页文本信息的结构和内容特征，提出一种网页主题文本信息的抽取策略，将网页文档表示为DOM标签树的形式，然后根据Web页面的结构特......

期刊

HTML标签网页分块内容特征信息抽取 HTML tags Web page segmentation content features informa

基于链接分块的相关链接提取方法

每个网页都包含了大量的超链接，其中既包含了相关链接，也包含了大量噪声链接。提出了一种基于链接分块的相关链接提取方法。首先，将网......

期刊

网页分块链接块相关链接提取 page segmentation link block relation link extraction

基于分块和净化的搜索引擎排序算法

展开了对互联网搜索引擎结果集的智能排序研究，提出了一种基于扩展网页质量和VIPS分块算法的智能网页排序算法，并对结果进行净化处理......

期刊

搜索引擎排序算法网页分块净化处理 search engine ranking algorithm Web page segmentation purify

基于网页分块技术主题爬行器的实现

针对目前通用搜索引擎搜索到的结果过多、与主题相关性不强的现状，提出一种基于网页分块技术的主题爬行器实现方法，并实现了一个原型......

期刊

主题搜索主题爬行相关度分析网页分块 topic-specific search focused crawling relevance analysis

基于网页分块的搜索引擎排序算法改进

目前,搜索引擎以整张网页作为最小处理单位进行排序处理,容易受到噪音信息的干扰.针对存在的问题,提出用网页分块对网页净化,进而......

期刊

网页噪音网页分块网页净化排序算法 VIPS webpage noise webpage segmentation webpage purificati

改进的基于本体的Web信息抽取

针对Web信息抽取主要依据内容进行抽取的思想,通过对基于本体的Web信息抽取技术的分析,在对网页进行预处理的过程中引入网页分块思......

期刊

信息抽取网页分块本体抽取规则准确率 Information extraction Webpage segmentation Ontology Extra

主题爬行中的隧道穿越技术

由于网络环境的复杂性和网页内容的多主题性，要想得到更多的特定主题相关网页，就要穿越那些主题不相关网页来获取更多的主题相关网页......

期刊

主题爬行灰色隧道穿越黑色隧道穿越网页分块 TARGET LENGTH focused Web crawling grey tunneling blac

结合网页结构与文本特征的正文提取方法

网页中存在正文信息以及与正文无关的信息，无关信息的存在对Web页面的分类、存储及检索等带来负面的影响。为降低无关信息的影响，从......

期刊

正文提取网页去噪网页分块主题爬行信息检索 Web挖掘 content extraction Web page denoising Web page

一种基于分隔条的网页分块算法

网络信息时代的到来使得网络中的信息量呈指数增长,由此研究如何从网页中高效地提取出有用信息成为网络信息检索领域中的重要课题......

期刊

Web分块视觉特征分隔条网页分块 Web segmentation Visual characteristic Separator bar Page se

基于自适应四叉树的网页分块技术

不同的浏览器对于相同网页的解释会有差异,在对跨浏览器兼容性测试时通常需要对网页进行分块,而网页的不兼容性对于用户来说往往需......

期刊

四叉树网页分块均方误差自适应 Quadtree Webpage Blocking Mean Square Error Adaptive

基于 HowNet 的用户兴趣挖掘研究及应用磁

搜索引擎中用户查询和网页资源之间的相似度研究一直是页面排序的研究核心。利用 HowNet 对词语的语义层次架构模型，对用户的检索词......

期刊

HOWNET 用户兴趣挖掘网页分块页面排序搜索引擎 HowNet user＇s interest mining web segmentation page

引入主题链接块因子的候选链接搜索策略研究

网页主题爬取过程中,需要计算网页中出现的url权重,不断填充待爬行队列,以满足爬行条件,如何发现与主题最相关的链接,同时又不会导......

期刊

网页分块 Shark-search算法链接结构主题链接块 page-block Shark-search algorithm link-structure

面向网页结构特征的Hopfield算法

针对目前互联网信息资源广泛、网页结构复杂、噪音信息较多的现状,主题爬虫获取有效信息过程中精确度低、耗费时间长等问题。结合......

期刊

垂直搜索网页分块主题爬行相关度计算 vertical search page segmentation topic crawling relevan

基于维基百科和网页分块的主题爬行策略

针对传统主题爬行策略的不足和局限性,提出一种基于维基百科(Wikipedia)和网页分块的主题爬行策略,通过Wikipedia的主题分类树和主......

期刊

主题爬行维基百科主题描述网页分块相关度计算 focused crawling Wikipedia topic description page segm

基于分块的网页信息解析器的研究与设计

详细介绍了网页信息解析的基本技术手段,在综合权衡优缺点的基础上,提出了针对新闻网站复杂结构页面较为有效的分块算法,并结合......

期刊

WEB挖掘 HTML标记视觉特征网页分块 Web miningHTML tagvisual cuespage segmentation

基于分块重要性模型与Xpath的Web信息抽取的研究

网页分块方法使得Web信息抽取的单位由页面缩小为块。文中研究了网页分块的主要方法与基于学习的分块重要性模型，对Xpath的Web抽取......

期刊

网页分块块重要性权重 XPATH WEB信息抽取 page segment value of block importance Xpath Web infor

基于结构树的网页正文内容抽取方法

网页文本抽取是一种在互联网上运用广泛的数据挖掘技术，主要目的是把一个网页的主题内容抽取出来，为Web数据挖掘提供好的基础数据。......

期刊

结构树信息抽取网页分块 structure tree information extraction page segmentation

面向移动设备的网页切割研究与设计

移动手持设备因其屏幕小，有限的计算及存储能力而不便浏览普通Web页面；另一方面，对于PDA、手机用户，本着用户个性定制以及降低费用的原......

期刊

DOM 噪音清洗网页分块网页切割网页重构 DOMWeb page cleaningWeb page blockingWeb page cuttingWeb

大规模垂直搜索方法的研究与实现

随着互联网的蓬勃发展,Web中每天都会产生大量的网页,这些网页内容千差万别。面对海量的Web网页信息资源,搜索引擎作为信息获取的......

学位

垂直搜索主题判断链接评价网页分块

分块布局下的主题型网页的内容抽取

本篇论文以去除网页噪声，整合网页内容为目标，提出了面向主题型网页，根据网页规划布局抽取网页内容的方法。算法首先分析原始网页的DO......

期刊

网页内容抽取网页分块网页去噪 Web page content extraction page segmentation Web page cleani

基于分块重要度和二维条件随机场的Web信息抽取

网页分块方法使得Web信息抽取的单位由原来的页面缩小为分块．结合分块重要度模型与二维条件随机场的优点，提出一种Web对象信息抽取方......

期刊

WEB对象信息抽取网页分块分块重要度模型二维条件随机场 time-seriesgranular computinguncertainclustering

基于动态隧道算法的网络爬行器设计与实现

在分析传统网络爬行器爬行算法的基础上，通过将隧道算法和网页页面分块技术相结合，指导专题爬行器进行爬行。通过4所高校门户网站的......

期刊

爬行器隧道穿越网页分块 Web crawlers Tunneling Web page division

教育新闻网页信息抽取系统的设计与实现

互联网是世界上最丰富和最密集的信息来源，近年来随着网络信息爆炸式的增长，Web新闻网页信息已成为人们获取信息的主要渠道。如何在......

学位

信息抽取网页分块启发式规则 HMM

基于网页结构的信息抽取关键技术研究

互联网已经成为人们生活中重要的信息来源,在网络信息快速增长的情况下,如何从海量的信息中找到用户所要的信息是一个很大的挑战。......

学位

搜索引擎主题型网页网页分块木棉检索系统信息抽取

面向垂直搜索引擎的主题爬行技术研究

主题爬行是获取World Wide Web中特定领域（主题）的网页的关键技术。随着Web的快速增长,以及网络带宽和各种资源的有限性,从中获取全......

学位

垂直搜索主题爬行主题描述网页分块相关度计算相关度预测优先级计算

看过本文同时还关注