【摘 要】
:
逻辑推理是人类智能的核心,也是人工智能领域的一个关键且具有挑战性的研究课题。人工智能当前在图像的识别和分类任务上取得了显著的进步,但不足之处在于当前的识别系统缺乏推理能力。人工智能的目标之一是开发具有类似人类逻辑推理能力的机器,因此我们有必要来深入理解机器中的学习和推理。如何让计算机学习拥有类似人类的逻辑推理能力是一个非常重要的研究内容。当前的人工智能推理技术仍不成熟,让机器直接进行推理是比较困难
【基金项目】
:
国家自然科学基金项目(61672332,61802238,61603228,62006146,F060308); 山西省回国留学人员科研项目(2017023,2018172,HGKY2019001); 山西省青年基金项目(201901D211171,201901D211169);
论文部分内容阅读
逻辑推理是人类智能的核心,也是人工智能领域的一个关键且具有挑战性的研究课题。人工智能当前在图像的识别和分类任务上取得了显著的进步,但不足之处在于当前的识别系统缺乏推理能力。人工智能的目标之一是开发具有类似人类逻辑推理能力的机器,因此我们有必要来深入理解机器中的学习和推理。如何让计算机学习拥有类似人类的逻辑推理能力是一个非常重要的研究内容。当前的人工智能推理技术仍不成熟,让机器直接进行推理是比较困难的,在进行推理时往往需要为其提供先验知识或给定先验推理模式。针对这一不足,我们提出逻辑学习来研究机器的推理问题,目的是使机器可以从数据中直接学习逻辑模式,而无需事先设计或仅仅需要少量先验知识。智商(IQ)测试是定义和测试人类计算和逻辑理解能力的最常用方法之一,我们想要借助IQ测试问题来进行逻辑学习研究,那么机器是否可以从IQ问题中直接学出逻辑?基于这一问题,本文进行了如下的研究:(1)提出了图像描述IQ问题的视觉逻辑学习任务。目的是让计算机在不知道图像间关系和图像内所包含内容的意义的前提下直接学习IQ图像间的逻辑模式。对IQ问题视觉逻辑学习任务进行了定义和形式化表达,并针对该任务设计了复杂IQ问题数据集Fashion_IQ,每个IQ问题的示例包括三张上下文问题图片和四张候选答案选项图片,其中这三张上下文问题图片是依次按照某种变换产生的,计算机需要学出上下文图片间的逻辑变换模式从而推理选出正确的候选答案。(2)验证了图像描述IQ问题的视觉逻辑学习任务的可行性。在三种传统神经网络模型上进行实验,探索在不为神经网络设计任何先验推理模式的前提下,直接学习IQ问题图像之间存在的逻辑模式进行推理。通过对不同模型在数据集Fashion_IQ的不同变换的IQ问题上的推理准确度的分析,实验结果表明神经网络在纯数据驱动下,通过训练可以学出IQ问题图像间的逻辑模式,并推理出正确的答案。从而验证了图像描述IQ问题的视觉逻辑学习任务的可行性。(3)提出一种新的方法-时序关系网络来解决现有神经网络模型在图像描述IQ问题视觉逻辑任务上表现不佳的问题。基于IQ问题具有时序性的特点,本文提出了一种时序关系网络的逻辑推理模型,模型借鉴了LSTM处理时间序列数据的思想,使用关系网络模块将CNN提取出的IQ问题图像的空间特征和LSTM提取出IQ问题图像的时序特征相结合得到时序-空间关系特征,来进行进一步的推理。通过实验对比验证,本文提出的这种逻辑推理方法在解决图像描述IQ问题视觉逻辑推理任务时取得了最好的表现。并进行了IQ问题图灵测试,通过对比时序关系网络模型和人类受试者在做本文设计的复杂IQ问题时的推理准确度,说明机器可以取得接近于人类甚至在一些IQ问题上超越人类的推理准确度。本文以让神经网络来学习推理类似人类的IQ测试题为例,来探索在无先验模式的前提下让机器直接学习图像间的逻辑模式,验证了逻辑学习以纯数据驱动的方法学习逻辑模式进行推理的可行性,为视觉逻辑学习设计了一种新的逻辑推理任务,为机器进行逻辑推理这一研究方向提供了新的思路和方向,这对于研究机器的推理任务具有一定的意义和应用价值。
其他文献
近年来,随着物联网迅速发展,射频识别技术(RFID,Radio Frequency Identification)被广泛应用于物流追踪、身份识别与国防军事等多个领域。目前,由于有芯片RFID传感器标签制作成本较高,所以设计低成本的无芯片RFID(Chipless RFID)传感器标签成为现今研究热点。本文针对无芯片RFID传感器标签的抗杂波性能进行研究与设计,具体从传感器标签的结构设计、极化转换特
网络资产是指连接到互联网的网络设备、安全设备、中间件、服务器、个人计算机等设备的类型和版本、操作系统类型、IP地址、开放端口及端口服务等信息。对网络资产进行探测和管理既可以帮助企业网络资产管理人员清楚地了解企业内部拥有的网络资产,又可以作为渗透测试人员或黑客开始工作前的信息收集,因此,对各种网络资产信息进行有效探测是必不可少的。其中,操作系统是各种设备运行的基础,当前市面上的操作系统类型众多,而现
近年来随着信息技术的快速发展和数据获取方式的不断丰富,人们对于图像视频类数据的处理需求也越来越多,目标跟踪作为图像视频类数据处理的重要技术,与之相关的研究也变得异常火热。从基于传统计算机视觉技术的相关滤波算法到基于深度学习跟踪模型的出现,跟踪算法的性能得到大幅提升。但是,在目标跟踪领域始终面临着多方面的挑战,如:复杂的背景、光照变化、目标物被遮挡以及运动物体的旋转尺度变化等,严重影响现有目标跟踪算
在互联网信息技术普及的21世纪,流行媒介作为现代化生活直接有效的信息传播方式,形成以数字媒介为主体的发展趋势。它丰富的图像语言以及广泛的视觉传播性得到了大众的认可。抽象立体形态的图像语言借助媒介反映了人们追求时尚理念与情感表达的诉求。笔者尝试和运用抽象立体形态语言进行创作,展现客观物体的三维形态,本研究以基础理论作为支撑,在C4D软件技术背景的支持下,将传统文化形象最终以抽象立体的形态语言呈现出来
近年来,随着自然语言处理技术的快速发展,聚焦于词级、短语级的研究已取得显著进展,针对于句子级的语义分析任务还相对较少,因此侧重于理解句子语义的篇章句间关系识别任务得到了研究者们的广泛关注。该任务作为篇章语义分析中的一项核心任务,旨在研究篇章内部论述单元(简称为“论元”)的逻辑语义关系,如因果关系、比较关系等。如何更准确的挖掘论元的深层语义信息是研究该任务的关键,也是影响模型性能的主要因素。本文主要
在当今数据爆炸的时代,数据降维是机器学习、模式识别以及数据挖掘等领域的共性问题之一。伴随着数据采集相关技术的快速发展应运而生的是大规模的高维数据的出现,普遍存在于数据处理应用过程中。当今数据采集技术的发展水平的仍有局限,数据源种类众多,数据类型也发展的更为多元化,采集阶段会将部分低质量数据比如噪声数据纳入采集结果中。虽然高维数据具有更全面的特征信息,可以更好的去刻画数据内部结构,但是无疑会带来负面
从图像中提取有价值的信息是尤为重要的,它为视觉信息处理提供了必要的前提和技术基础。而显著性检测则是提取有用信息的有效手段之一,它通过模拟人类注意机制,可以检测出人的视觉系统优先关注到的区域,为后续复杂的图像处理任务降低了处理难度。因此,研究视觉显著性检测极具研究意义和应用价值。基于深度学习的显著性检测算法能够获得相较于传统方法更精细的检测结果。然而,目前的检测效果不能获得准确的显著目标定位,同时所
目标跟踪技术是机器视觉研究领域极为重要的组成部分,已在军用和民用领域得到了广泛应用。由于视觉跟踪技术需要面对目标被遮挡、光照变化、快速运动等具有挑战性的场景,同时,现有运算平台大多数是一些高功耗和大体积的系统。因此需要设计一种鲁棒的多策略目标跟踪算法,且使用低功耗和小体积的嵌入式开发系统。论文重点研究和设计一种能够解决实际场景问题的多策略目标跟踪系统,改进核相关滤波目标跟踪算法,并在嵌入式系统上完
随着物联网的发展,RFID技术目前正广泛地应用于越来越多的场景中。RFID系统通常需要在较远的读取范围内操作,并且要准确和低成本。有芯片RFID标签支持较远的读取范围,但成本较高。相比之下,无芯片RFID标签成为提高标签可靠性和降低成本的一种有效方案。由于没有芯片的存在,标签仅靠散射阅读器发射来的电磁波来传输有用信号,导致传输距离短。因此本文针对无芯片RFID远距离传感的问题展开研究,主要研究内容