计算视觉中三维重建、图像增强及模式分类问题的新方法

来源 :复旦大学 | 被引量 : 0次 | 上传用户:syh904
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
计算视觉是计算机利用其图像采集设备拍摄目标物、分析处理,以帮助或代替人眼和人脑完成相关视觉分析任务的一项科学技术。计算视觉的典型任务包括:识别、运动分析、场景重建、图像增强等。工业生产和生活中的应用包括:指纹/人脸识别、异常监控、三维重构、图像反模糊等。本文的研究工作涉及计算视觉中三个重要的、有着广泛应用的问题:三维重建、图像增强和模式分类,提出并实践新方法。本文的主要贡献包括:(1)在“三维重建”问题域中提出使用“相对极线运动”这一概念,以求解双目立体视觉中的对应点匹配问题。该方法能够有效的匹配和重建“具有大量局部不可区别的运动特征点”的场景。(2)对于“图像增强”的“反模糊”问题,本研究通过构建“对偶相机”,即结合“高分辨率低帧率”和“低分辨率高帧率”两个相机,首次使“多核反卷积”在实践上成为可能,且实验表明使用本文“对偶相机”和“多核反卷积”获得的增强后的图像质量,普遍优于使用经典的广为研究的“单核反卷积”方法的结果。(3)在“模式分类”中,本文提出“样本分布集中”这一概念。本文基于“最近特征线NFL”方法及为了克服其“外部误差”和“内部误差”,提出一种新的模式分类方法——“最近特征线段RNFLS”。分析和实验表明,相对NN,k-NN,NFL,NNL等分类器,RNFLS的“样本分布集中属性”使其在人工和真实数据分类任务中有优异的表现。
其他文献
现在,计算机软件系统逐渐变得越来越复杂,本身的开发难度更是在不断增加。传统的开发方法主要依靠手工方式,效率低下、质量欠佳、正确性难以保证。泛型程序设计(Generic Prog
随着电信服务市场竞争的日益激烈,各运营商意识到,单纯的“价格战”已经不能满足企业发展的需要,而不断深入的企业信息化则成为了各运营商提升自身竞争力的重要手段。电信企
评论挖掘就是对评论文本的挖掘与分析,包括对文章主客观性的判断和评论褒贬义的判断以及句子层的评论文章基本要素的抽取,如抽取评论对象的名称,特征,评论词以及态度倾向等。
单芯片多处理器(CMP:Chip multi-processors)是高性能微处理器结构设计的发展方向。片内多个处理器核共享cache可能会导致共享数据不一致的问题,为此提出了两种协议机制:监听
天然岩石节理裂隙普遍存在于各类岩石中,了解节理裂隙的性质对于地质、地球物理、采矿、石油工程、水文地质以及核废料隔离都具有重要意义。岩石节理裂隙研究的一项重要内容
让计算机视觉系统自动定位图像中的物体和区分物体类别,使其具备简单的分类决策能力是本文研究的出发点。主要研究内容包括学习方法的改进、分类器的设计、视觉物体检测和视觉
在软件系统的生命周期中,70%的时间和代价花费在软件维护上。以数据为中心的遗产系统,如商业信息系统,通常依赖于大量的数据库表(数据文件)。对这类系统进行维护和更新,是一
IP多播已经在流媒体传递技术,比如在高速网络数据流和视频会议等方面取得了一定的成功。但是某些缺点导致了IP多播尚未被大范围部署,并且也不能作为一项基本的网络服务提供给终
IP多媒体子系统(IP Multimedia Subsystem,IMS)是一种全新的提供多媒体业务的网络架构,它能够满足用户更新颖、更多样化的多媒体业务需求。3GPP R5和R6版本指出,IMS需要支持I
VPN即虚拟专用网络(Virtual Private Network)是指利用隧道协议和安全措施在公用网络上构建的专用网络,这里的公用网络主要指Internet。“虚拟”的含义是指在开放、不安全的