事实证明,机器学习(ML)算法是解决各种现实问题(包括图像、音频和文本分类任务)的极有价值的计算工具。全世界的计算机科学家每天都在开发更多这些算法。因此,跟踪它们并快速找到或访问过去引入的内容变得越来越具有挑战性。
考虑到这一点,普渡大学和辛辛那提大学的研究人员最近创建了HAMLET,该平台可以帮助计算机科学家和开发人员浏览现有的机器学习模型并训练或评估自己的算法,从而帮助他们进行研发工作。该平台在arXiv上预先发表的一篇论文中提出,可以最终使世界各地开发的机器学习模型民主化,从而使研究团队可以彼此共享他们的模型。
进行这项研究的研究人员之一艾哈迈德·埃斯马埃利(Ahmad Esmaeili)告诉TechXplore:“组织和跟踪机器学习算法和数据集一直是我们以及该领域其他许多研究人员面临的重大挑战。”
“当ML解决方案和组件的数量随着时间的推移以及从一个项目到另一个项目的数量持续增长时,这一点变得尤为重要。在开发HAMLET时,我们致力于通过不仅管理可用的ML贡献,而且还创建一个满足上述需求的平台。资产以分布式的方式进行,还可以促进诸如有效访问,同时还比较和评估这些资源的操作。”
HAMLET代表基于分层代理的机器学习平台,由一组AI代理组成,这些AI代理经过训练可以“管理”大量ML算法、相关资源(例如,数据集)和ML模型要完成的任务。研究人员定义了“管理”平台的人工代理的技能,这些人工代理基于它们所代表的算法,数据或任务而排列在层次结构的不同级别上。
Esmaeili解释说:“ HAMLET平台从一个空的结构开始,随着新的ML资源/查询的引入,将继续自主增长。”
“基于多代理系统,HAMLET可以分布在计算机和设备的网络上;因此,对其可以托管的算法/数据的大小和类型没有限制。”
HAMLET平台具有用户友好的界面和灵活的查询结构。研究人员可以使用它来执行各种任务,例如单独或分批地训练和测试其算法。
为了测试其有效性,Esmaeili和他的同事使用它在用SPADE(智能Python代理开发环境)开发的模拟环境中完成了120个培训和四个批处理测试任务。他们使用9个著名的AI训练数据集反复测试和训练了24种ML算法。他们的实验结果表明,HAMLET是用于训练和测试ML算法的非常有前途和有用的工具。
“毫无疑问,机器学习方法正在变得越来越普遍,” Esmaeili说。“ HAMLET促进了ML解决方案的民主化,并帮助ML研究社区,无论其地理位置如何,都可以轻松地共享和跟踪其方法和资源。”
将来,Esmaeili和他的同事创建的平台将被全世界的研究人员用来在多个数据集上训练新的ML算法,识别用于特定目的的现有模型或评估新算法并将其性能与其他现有算法进行比较。在HAMLET上,所有这些任务都可以通过一个查询轻松完成。
Esmaeili说:“该项目尚处于起步阶段,可以在许多方面进行改进,以确保它更好地满足当前的研究和工业需求。”
“在接下来的研究中,我们计划继续致力于支持更复杂的算法、平台针对故障的生存能力、合并多个平台以及访问数据或算法的私密性。”