视错觉可以帮助我们构建下一代人工智能

您在圆点网格上查看黑色圆圈的图像。它类似于在一块白色网状材料上烧出的一个洞，尽管它实际上是屏幕或纸上的一个平面、静止的图像。但是你的大脑不会这样理解它。就像一些低级的幻觉体验一样，你的大脑跳脱了；将静态图像感知为向您移动的黑色隧道的口。

响应逼真的效果，身体开始无意识地做出反应：眼睛的瞳孔会扩大以让更多的光线进入，就像当你即将陷入黑暗时它们会进行调整以确保获得最佳视觉效果一样。

有问题的效果是由日本神户立命馆大学的心理学家Akiyoshi Kitaoka创造的。这是他在漫长的职业生涯中创造的数十种视错觉之一。（“我都喜欢，”他回答 Digital Trend 关于他是否有最爱的问题时说。）

这种新的错觉是最近发表在《人类神经科学前沿》杂志上的一项研究的主题。虽然这篇论文的重点是人类对这种新效应的生理反应（事实证明，我们中约有 86% 的人会经历这种反应），但总体主题也可能与未来的机器智能——正如其中一位研究人员急于向 Digital Trends 解释的那样。

进化优势

一种被称为弗雷泽螺旋的视错觉 — 乍一看，这张图片似乎显示了一个向中心盘旋的螺旋。但是尝试沿着其中一条线，因为它似乎向内弯曲，你会意识到它根本不是螺旋形的。

你的大脑有问题。至少，这是从人脑感知视错觉的方式中得出的一个简单结论。对于大脑认为完全不同的二维静态图像，还有什么其他解释？很长一段时间，主流心理学都明白这一点。

“最初人们认为，'好吧，我们的大脑并不完美……它并不总是正确的。'那是失败，对吧？”奥斯陆大学心理学系教授、上述研究的第一作者布鲁诺·朗说。 “这种情况下的幻觉很有趣，因为它们会揭示机器中的某种缺陷。”

心理学家不再那样看待他们。如果有的话，像这样的研究强调了视觉系统不仅仅是一个简单的相机。 “幻觉扩大孔”视错觉清楚地表明，眼睛会适应感知的甚至想象的光与暗，而不是物理能量。

最重要的是，它展示了我们不只是用我们的视觉系统愚蠢地记录世界，而是为了获得轻微的进化优势而进行一系列连续的科学实验。目标是分析呈现给我们的数据，并尝试在问题成为问题之前先发制人地处理它们。

“大脑无法知道[真正] 外面是什么，”Laeng 说。 “它正在做的是建立一种可能存在的虚拟现实。有一点猜测。在这方面，您可以将大脑视为一种概率机器。如果你愿意，你可以称它为贝叶斯机器。它使用了一些先前的假设，并试图一直对其进行测试，看看它是否有效。”

Laeng 举了一个例子，我们的眼睛只是根据太阳光的印象进行调整：即使是透过云层或头顶的树叶看到的。以防万一。

“进化中重要的不是[在那一刻]它是真的，而是它是可能的，”他继续说道。 “通过收缩瞳孔，你的身体已经在适应很可能在短时间内发生的情况。 [如果太阳突然出来] 会发生什么，你被眼花缭乱了。 Dazzled 意味着暂时失去能力。无论您是猎物还是捕食者，这都会产生巨大的后果。在特定情况下你会失去一秒钟的时间，你可能无法生存。”

我们的视觉系统需要猜测的不仅仅是光明和黑暗。想象一场网球比赛，球高速运动。如果我们的行为完全基于视觉系统在任何特定时刻接收到的信息，我们就会落后于现实，无法回球。 “虽然我们真的被困在过去，但我们能够感知现在，”Laeng 说。 “唯一的办法就是预测未来。这听起来有点像文字游戏，但简而言之就是这样。”

机器视觉越来越好

那么这与计算机视觉有什么关系呢？潜在的一切。例如，为了让机器人能够在现实世界中有效运作，它需要能够在运行中进行这些类型的调整。计算机在执行极快计算的能力方面具有优势。他们没有的是数百万年的进化。

近年来，机器视觉仍然取得了巨大的进步。他们可以识别实时视频流中的面孔或步态——甚至可能在大量人群中。类似的图像分类和技术工具也可以识别其他物体的存在，而物体分割的突破使更好地理解不同场景的内容成为可能。在从 2D 场景推断 3D 图像方面也取得了重大进展，允许机器从场景中“读取”三维信息，例如深度。这使现代计算机视觉更接近人类的图像感知。

然而，最好的机器视觉算法与绝大多数人类从小就能够执行的基于视觉的能力之间仍然存在鸿沟。虽然我们无法准确地说明我们如何执行这些基于视觉的任务（引用匈牙利-英国博学家 Michael Polanyi 的话，“我们知道的比我们知道的多”），但我们仍然能够执行一系列令人印象深刻的任务，这些任务让我们以各种聪明的方式驾驭我们的视力。

机器视觉的图灵测试

如果研究人员和工程师希望创建至少与湿件大脑的视觉处理技能相当的计算机视觉系统，那么构建能够理解视错觉的算法并不是一个糟糕的起点。至少，它可以证明是衡量机器视觉系统对我们自己大脑运行情况的好方法。它可能不是神话般的通用人工智能的答案，但它可能是解锁通用视觉的关键。

一种视觉错觉，会诱使您的大脑看到错误的颜色 — 信不信由你，但所有这些球都是相同的灰色阴影，你的大脑会根据跨越它们的彩色线条的上下文提示将它们解释为具有不同的颜色

“如果有人有一天会开发出一种人工视觉系统，它会犯下与我们相同的虚幻感知错误，此时你就会知道他们正在[实现]我们大脑如何工作的良好模拟，”Laeng 说。 “这将是一种图灵测试。如果你有一个像我们一样被幻觉愚弄的人工网络，那么我们[将]非常接近理解大脑本身的基本计算。”

英国萨里大学视觉语音和信号处理中心的计算机视觉和机器学习的读者宋一哲同意这个假设。 “要求视觉算法将视错觉作为一个一般性话题来理解，这对社区来说非常有价值，”他告诉 Digital Trends。 “它超越了当前要求机器[识别]的社区焦点，进一步推动信封[和]要求机器推理。这种推动 [将代表] 向‘通用视觉’迈出重要一步，在这种情况下，需要适应对视觉概念的主观解释。”

运用你的幻想

迄今为止，针对这一目标的研究有限——尽管它仍处于相对早期的阶段。 Nasim Nematzadeh，拥有博士学位的研究员。在人工智能和机器人技术 – 低级视觉模型中，是一个发表过关于这个主题的作品的人。

“我们相信，进一步探索简单的类高斯模型在低级视网膜处理和早期高斯核[深度神经网络]中的作用，以及它对感知错觉损失的预测，将导致更准确的计算机视觉技术和模型，”Nematzadeh 告诉 Digital Trends。 “[这可能]有助于更高层次的深度和运动处理模型，并推广到计算机对自然图像的理解。”

人工智能研究员 Max Williams 帮助为计算机视觉系统编译了数千张视错觉图像的数据集，他最简洁地阐述了一般视觉和视错觉之间的关系：从原本无法理解的光场中提取视觉场景的过程，该光场由我们几乎完全与世隔绝的物理世界创造，”他们告诉 Digital Trends。 “我认为不可能使视觉系统具有足够的表现力，从而被认为是‘感知’，它也没有幻觉。”

实现总体愿景

需要明确的是，实现人类水平（或更好）的人工智能通用视觉不仅仅是训练他们识别标准的视错觉。比如说，在 0.001 秒内以 99.9% 的准确率解码魔眼幻觉的超特异性能力无法替代人类数百万年的进化。

（有趣的是，机器视觉确实已经有自己版本的对抗模型形式的视错觉，这可能会使它们误认为——例如在一个令人震惊的例子中——步枪的 3D 打印玩具乌龟。然而，这些不会产生与对人类起作用的视错觉具有相同的进化益处。）

尽管如此，让机器理解人类的视错觉，并以我们的方式对它们做出反应，可能是非常有用的研究。

有一件事是肯定的：当实现通用视觉 AI时，它会像我们一样陷入同样的视错觉。至少，在虚幻膨胀洞的情况下，我们中的 86%。