卷积神经网络是一种人工神经网络,其中神经元被组织成接受区,其方式与生物大脑视觉皮层的神经元非常相似。如今,卷积神经网络(CNNs)被应用于各种各样的自主系统(例如,人脸检测和识别,自动驾驶汽车等)。这种类型的网络在许多人工视觉任务中非常有效,如图像分割和分类,以及许多其他应用。
卷积网络的灵感来自于人类视觉系统的行为,特别是其基本结构是由一系列复合模块构成的,这些模块由一个线性操作接着一个非线性操作。一项发表在《视觉研究》杂志高级网络版上的研究对卷积网络中的视觉错觉现象进行了对比,并将其与人类视觉的影响进行了比较。这是一项由巴伦西亚大学信息与通信技术系(DTIC)成员Alexander Gomez Vila, Adrian Martin, Javier Vazquez-Corral和Marcelo Bertalmio与研究员Jesus Malo共同参与的研究。
“由于cnn与我们的视觉系统之间的这种联系,在这篇论文中,我们想看看卷积网络是否会遭遇与我们的视觉系统类似的问题。”因此,我们关注视觉错觉。视觉错觉是我们大脑感知到的图像与它们实际的样子不同,”研究的第一作者戈麦斯·维拉解释说。
在他们的研究中,作者训练神经网络去噪和去模糊等人类视觉也能完成的简单任务。他们观察到,在这些实验条件下训练的神经网络也会被亮度和颜色的视觉错觉“欺骗”,就像视觉错觉欺骗人类一样。
戈麦斯维拉说,“等我们的工作我们还分析当幻想导致的网络反应并不像人们想象的身体,但也不与人类感知,”也就是说,美国有线电视新闻网获得的情况不同的光学错觉幻觉,人类感知。
这项研究的结果与长期以来的假设是一致的,即认为低级视觉错觉是优化自然环境的副产品(人类在日常生活中看到的)。同时,这些结果凸显了人类视觉系统与CNNs人工神经网络的局限性和差异。