研究人员发现了一个可以大大减少训练人工智能系统所需的数据集大小的数学思想

研究人员发现了一个可以大大减少训练人工智能系统所需的数据集大小的数学思想_人工智能_AI+


滑铁卢大学的统计学家提出了一个数学过程的想法,它可以在不需要大数据集的情况下教授人工智能系统。伊利亚·苏霍鲁茨基和马蒂亚斯·肖洛写了一篇论文,描述了他们的想法,并发表在arXiv预印本服务器上。


人工智能(AI)应用是近年来研究的热点,随着深度学习网络的发展,许多领域的研究人员开始发现它的用途,包括制作deepfake视频、棋盘游戏应用和医学诊断。


深度学习网络需要大量的数据集来检测显示如何执行给定任务的模式,例如从人群中挑选某张脸。在这项新的研究中,研究人员想知道是否有办法缩小数据集的大小。他们指出,孩子们只需要看几张动物图片就可以认出其他的例子。作为统计学家,他们想知道是否有办法用数学来解决这个问题。


研究人员根据麻省理工学院的一个团队最近的研究成果。他们发现,在一个名为MNIST的数据集中提取描述手写数字的最相关信息并将它们打包在一起,大大减少了人工智能系统学习识别新数据集中字母所需的字符数量。加拿大的两位研究人员指出,这个系统之所以能够用更少的数据学习,是因为它被训练以一种新的方式识别数字:他们训练它识别目标是一个看起来有点(30%)像数字8的数字,其他数字也一样。他们称这些暗示为软标签。


然后他们将这个想法进一步应用到一种叫做k-最近邻(kNN)的机器学习中,这使得他们能够将他们的想法转化为图形化的方法。使用这种方法,他们能够将软标签应用到描述图形上XY坐标的数据集上。结果,人工智能系统很容易被训练成将点放在他们画的直线的正确边上,而不需要一个大的数据集。研究人员将他们的方法描述为“less than one-shot learning”(loshot),并建议可能将其扩展到其他领域,他们承认仍有一个主要障碍需要克服,因为系统仍然需要一个大的数据集来启动筛选过程。


参考文献:'Less Than One'-Shot Learning: Learning N Classes From M < N Samples, arXiv:2009.08449 [cs.LG] arxiv.org/abs/2009.08449。

98
197
0
54

相关资讯

  1. 1、《等风来》发话题视频倪妮引发白领共鸣3294
  2. 2、赵本山又一弟子宣布当导演,片名接地气,网友却求放过?3767
  3. 3、斯派克·李将获颁棕榈泉国际电影节终身成就奖151
  4. 4、中视美星《蓝天花朵》谭涛关心单亲家庭的孩子634
  5. 5、董津初:李焕英也曾经是花季少女啊4352
  6. 6、湖南卫视第一轮新节目收视低第二波正在筹备中1513
  7. 7、《脱轨时代》海报起争议网友问亮点珠去哪儿了3167
  8. 8、当年一个背叛吴京,一个救急《战狼2》,如今两人差距不是一般大821
  9. 9、奇幻电影《发丘陵冢》盛大开机,巫山秘境再现摸金传奇!561
  10. 10、禁止套娃!漫威主演集体溜号,奇异博士可太忙了3127
全部评论(0)
我也有话说
0
收藏
点赞
顶部