滑铁卢大学的统计学家提出了一个数学过程的想法,它可以在不需要大数据集的情况下教授人工智能系统。伊利亚·苏霍鲁茨基和马蒂亚斯·肖洛写了一篇论文,描述了他们的想法,并发表在arXiv预印本服务器上。
人工智能(AI)应用是近年来研究的热点,随着深度学习网络的发展,许多领域的研究人员开始发现它的用途,包括制作deepfake视频、棋盘游戏应用和医学诊断。
深度学习网络需要大量的数据集来检测显示如何执行给定任务的模式,例如从人群中挑选某张脸。在这项新的研究中,研究人员想知道是否有办法缩小数据集的大小。他们指出,孩子们只需要看几张动物图片就可以认出其他的例子。作为统计学家,他们想知道是否有办法用数学来解决这个问题。
研究人员根据麻省理工学院的一个团队最近的研究成果。他们发现,在一个名为MNIST的数据集中提取描述手写数字的最相关信息并将它们打包在一起,大大减少了人工智能系统学习识别新数据集中字母所需的字符数量。加拿大的两位研究人员指出,这个系统之所以能够用更少的数据学习,是因为它被训练以一种新的方式识别数字:他们训练它识别目标是一个看起来有点(30%)像数字8的数字,其他数字也一样。他们称这些暗示为软标签。
然后他们将这个想法进一步应用到一种叫做k-最近邻(kNN)的机器学习中,这使得他们能够将他们的想法转化为图形化的方法。使用这种方法,他们能够将软标签应用到描述图形上XY坐标的数据集上。结果,人工智能系统很容易被训练成将点放在他们画的直线的正确边上,而不需要一个大的数据集。研究人员将他们的方法描述为“less than one-shot learning”(loshot),并建议可能将其扩展到其他领域,他们承认仍有一个主要障碍需要克服,因为系统仍然需要一个大的数据集来启动筛选过程。
参考文献:'Less Than One'-Shot Learning: Learning N Classes From M < N Samples, arXiv:2009.08449 [cs.LG] arxiv.org/abs/2009.08449。