【摘 要】
:
随着Internet/Intranet的迅速发展,基于WWW的网上信息的收集、发布和相关的信息处理日益成为人们关注的焦点。面对着网络上新闻信息数量和种类的高速增长,导致了一方面新闻信
论文部分内容阅读
随着Internet/Intranet的迅速发展,基于WWW的网上信息的收集、发布和相关的信息处理日益成为人们关注的焦点。面对着网络上新闻信息数量和种类的高速增长,导致了一方面新闻信息过度膨胀而另一方面用户却找不到所需要的新闻信息。如何在Internet环境下对各种信息进行收集、分析及评价并提供高效的新闻检索服务,成为目前计算机研究领域的一个热点。而随着手机的普及与便捷性的进一步提高,移动新闻搜索已成为一种趋势。基于JAVA的移动新闻搜索引擎系统设计并实现了一种基于中文视觉特征的网页页面内容的提取算法。该算法是根据人类判断网页正文的的视觉方式,依据汉字多少,整段中热字的数量,以及网页中超级链接数量等因素确定正文的段落,通过网页间节与节之间的关系确定主要的正文所在。论文对基于JAVA的移动新闻搜索引擎系统进行系统分析,给出了系统的设计原则及预期功能。系统采用全文搜索的方式,选择RSS作为数据源,建立了系统的基本架构,设计了基于JAVA的新闻搜索引擎系统,并且给出了具体的实现方案,实现了一个系统原型,并提出了若干改进用户体验的下一步工作。
其他文献
高光谱遥感图像凭借其较高的光谱分辨率,超高的光谱信息量以及相邻波段较高的相关性,具有较强的实用性,已成为遥感图像领域的一个研究热点,受到各国专家学者的青睐。相关向量机理论是2001年M.E.Tipping提出的一种新型的基于贝叶斯统计学习框架的有监督机器学习算法,该算法的提出弥补了传统SVM算法的不足。相关向量机通过回归估计获取预测值的概率分布,从而得到一个基于核函数的稀疏解,能够处理回归和分类问
进入“互联网+”时代,人们从生产、生活中积累的数据呈现爆发式增长,数据已成为重要的战略资源,如何利用海量数据发现新知识已成为数据挖掘领域的研究热点,其中,决策树分类算
人脸识别技术就是利用计算机分析人脸图像,提取有效的识别信息来辨认身份或者判别待定状态的一门技术。它结合人工智能、计算机图像处理、模式识别、心理学等研究领域,是当前
直接体绘制技术是三维数据可视化研究领域的一种重要方法,是科学可视化的研究热点之一。过去,体绘制中所有的计算都由CPU来完成,重建速度慢,很难达到实时绘制的要求,然而近年
NAND Flash通过Flash转换层把线性地址的Flash抽象成磁盘驱动器,‘使得基于磁盘驱动器的传统算法可以无需任何修改就能实现所有功能。但是由于NAND Flash的写速度小于读速度
随着社会经济的飞速发展,为了适应政策的变化以及预防潜在的经济危机,企业和政府管理部门就要适当的调整管理方式,甚至是业务处理过程。在这种背景下,传统的信息管理系统就面
高光谱数据含有的光谱波段数量少则几十多则数百,提供了大量的有价值信息,有利于对地物进行精细分类。而高光谱数据分类却面临着数据维数高,标记样本有限,人工标记成本昂贵等具有挑战性的问题。为了解决高光谱数据分类问题,不断有学者提出新的方法。无监督分类不需要人工进行标记,但是分类准确度相对较低。传统的监督学习取得了较好的分类效果,但需要大量的标记样本。此外,为了避免休斯现象,许多算法都需要对数据进行降维处
随着网格技术的发展与深入研究,地理上分散的异构资源可以通过网格技术组织成一个虚拟的超级计算机。网格任务调度就是如何最有效的管理和利用巨大的网格资源来的完成各种计
近年来,随着嵌入式计算、传感器和现代通信等技术的飞速发展和日益成熟,使得由各种低成本、低能耗、多功能的微型传感器组成的无线传感器网络被广泛应用于国防军事、环境监测
数学和计算机技术的不断发展,为数字图像和视频处理注入了新的活力。同时,人们对视觉信息的要求也越来越高,这对数字图像和视频处理来说,既是一个难得的机遇,也是一个巨大的