基于Web的专家搜索研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户：peng7330

【摘要】

：

所谓专家,是指具有一定专业技能的人员。在当今信息量骤增的时代,在企业内部网络上与万维网上搜索专家,是一个越来越重要的需求。然而,现有的专家搜索技术和工具无法满足这种

【作者】

：

段惠中

【机构】

：

上海交通大学

【出处】

：

上海交通大学

【发表日期】

：

2009年期

【关键词】

：

专家搜索专家识别搜索模型专家排名专家人名消歧

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

所谓专家,是指具有一定专业技能的人员。在当今信息量骤增的时代,在企业内部网络上与万维网上搜索专家,是一个越来越重要的需求。然而,现有的专家搜索技术和工具无法满足这种需求。对于企业内部网络的专家搜索已有一些相关研究,但目前仍没有一个统一的理论框架,并且检索效果仍无法满足用户实际需求,而对于万维网上专家搜索的研究目前寥寥无几。为了弥补这些研究上的空白,本文提出基于Web的专家搜索的研究。具体来讲,本文主要深入研究以下几个课题。专家的发现和识别是指自动的发现文档集中的所有专家,并将专家出现的位置进行识别和标记。它是建立一个专家搜索引擎的首要问题。本文提出了一种通过分析E-mail的方法,来自动获得文档集中的专家列表,并提出一个高效的识别专家在文档集中出现位置的算法。专家搜索模型是在给定专家列表的情况下,针对给定的查询在文档集中有效的进行专家检索。本文提出一个基于证据的专家搜索模型。在这个模型中,一个专家与查询的相关程度由文档集中的证据决定。实验证明,本文提出的检索模型可以有效的在Web文档集中检索相关专家。为了区别专家和普通用户,本文提出静态排名(Static Ranking)的方法来发现专家的重要程度。本文提出了基于链接分析专家排名算法(ExpertRank),并进一步发展出主题敏感的专家排名算法(Topic Sensitive ExpertRank)。在万维网上,人名的歧义现象很严重。一个人名的搜索结果往往对应着多个不同的个体。这成为了专家搜索的一个必须解决的问题。本文针对该问题提出了一种利用额外的反馈页面进行分类的框架,并在该框架下提出两种用于分类的特征:“关键词(Key Token)”和“主题(Topic)”。实验证明,这两种特征在提高消歧效果上有着重要的作用。此外,本文也深入讨论了不同分类方法的效果,并利用不同的取样方法处理数据不平衡带来的稳定性问题。

其他文献

无线传感器网络分簇路由算法的研究与改进

无线传感器网络作为一项新兴的信息技术,目前正成为计算机领域的一个活跃的研究分支。而由于无线传感器网络自身能量有限的特点,现有的无线路由技术并不适用于传感器网络,因

学位

无线传感器网络分簇算法多跳路由转发意愿

数据网格中动态复制技术和副本选择策略的研究

网格是一种无缝的、集成的资源共享和协作环境,它将网络上分散的各种计算机、存储设备、科学仪器等连接在一起,整合成一台巨大的虚拟超级计算机,以实现计算资源、存储资源、

学位

数据网格动态复制副本目录复制管理副本选择

关于三维人脸图像数据融合的研究

三维重建技术已广泛应用于多种领域,作为人的最主要特征,人脸的三维信息描述若应用于三维人脸识别、医学整容等方面意义重大,然而既有的三维扫描仪主要是用于刚体部件的三维

学位

三维图像测量点云图像融合离散球面球面网格划分正二十面体网格化插值

Web Service并发系统的设计与研究

随着Internet的发展和大规模应用需求的不断涌现，单个甚至多个Web Services也往往不能很好地满足一些复杂的应用。而目前对Web Services的研究多集中在开发、发布和部署方面，本

学位

Web Service并发系统小粒度服务动态队列抽象资源层总线控制

多感知通路在言语感知与生成中的作用

听觉反馈是研究言语生成与感知的重要手段。1994年Kawahara教授提出使用变换听觉反馈(Transformed Auditory Feedback,TAF)技术分析基频曲线,评估听觉反馈对言语生成与感知的

学位

生成与感知听觉反馈震动反馈基频控制频率调制

决策树在个性化金融对账单中的应用

如今，信用卡消费已逐渐成为一种重要的支付手段，通过信用卡交易既让消费者节省了交费时间，同时也令银行从中获得了很大利润。对账单是用户高度关注的单据，它不仅是信用卡的单纯附

学位

决策树信用卡消费个性化对账单数据清洗稀疏矩阵个性化推荐

基于距离变换的运动轨迹聚类分析研究

监控系统提供了收集信息和辅助保障安全的功能,随着科技不断的发展,如今越来越先进的摄像设备提供了大量移动对象的轨迹数据,例如行人、车辆、船舶、飞机等,而船只的突然停止

学位

轨迹分段聚类分析距离变换异常检测

基于信任的P2P文件共享系统的研究和实现

德国互联网调研机构ipoque称,P2P技术已经彻底统治了当今的互联网,其中总流量的50-90%都来自P2P程序。P2P技术由于其固有的优点,如非集中性、自治性、容错性和可扩展性等,已

学位

对等网络JXTA协议信任模型风险文件共享

基于JXTA的P2P资源搜索策略的研究与实现

随着对等网络规模和用户数量的增加,P2P环境下的信息量也随之飞速增长,给用户在搜索、定位和获取信息资源上都带来了巨大的困难。对等网络信息搜索技术是解决这一问题的重要

学位

对等网络JXTA资源搜索主题集合点视图

基于约束的时态推理和时态规划

一个实用的智能信息处理系统无法回避对时间元素的处理，在智能规划领域尤其是这样。正因为如此，时态规划吸引了智能规划研究者的广泛重视，成为近年来规划领域一个重要的研究主题

学位

智能信息处理智能规划时态推理模型时态规划系统约束可满足算法DTP求解器

基于Web的专家搜索研究

其他学术论文