大脑在物体视觉的初始阶段会检测到三维形状的碎片(突起、凹陷、轴、球体),这是约翰霍普金斯大学研究人员在训练识别视觉对象的人工智能网络中发现的一种新发现的自然智能策略。
《当代生物学》上的一篇新论文详细介绍了V4区的神经元是如何代表三维形状碎片的,而不仅仅是过去40年来研究V4的二维形状。约翰·霍普金斯的研究人员随后在高级计算机视觉网络AlexNet的早期阶段(第3层)鉴定出人工神经元的几乎相同的反应。在自然和人工视觉中,早期发现三维形状可能有助于解释真实世界中的固体、三维物体。
神经科学教授、Zanvyl Krieger Mind/Brain Institute主任埃德·康纳(Ed Connor)说:“我很惊讶早在V4就看到了强烈、清晰的三维图形信号。”但我从来没有想到过一百万年后,你会在AlexNet上看到同样的事情,AlexNet只接受过将二维照片转换为物体标签的训练。”
人工智能的长期挑战之一就是复制人类的视觉。基于为游戏开发的高容量图形处理单元(GPU)和由互联网上图像和视频提供的大量的机器学习训练集,AlexNet这样的深层(多层)网络在目标识别方面取得了重大进展。
康纳和他的团队对自然神经元和人工神经元进行了同样的图像反应测试,并在V4和AlexNet第3层发现了非常相似的反应模式。是什么解释了康纳所说的大脑之间的“诡异的对应”,大脑是进化和终身学习的产物。 康纳说,AlexNet和类似的深层网络实际上部分是基于大脑中的多级视觉网络设计的。他说,他们观察到的相似之处可能预示着未来有机会利用自然智能和人工智能之间的关联。
“人工网络是目前最有希望了解大脑的模型。相反,大脑是让人工智能更接近自然智能的最佳策略来源,”康纳说。
参考文献:Current Biology (2020). DOI: 10.1016/j.cub.2020.09.076。