大多数企业领导人声称,缺乏具备人工智能(AI)技能的合格人员一直是跨企业实施人工智能的主要障碍。随着越来越多的企业选择利用人工智能及其应用(例如机器学习和深度学习等),知识差距可能成为代价高昂的事情。尽管数据科学家正在帮助构建用于数据挖掘、分析、过滤原始数据的人工智能应用程序,以及选择一种训练机器学习模型的算法,但近年来它们的作用正在多样化。加上严重的人才短缺,随着数据科学家的职位迅速增加,企业面临着在数字化转型竞赛中落后的风险。因此,企业领导者正在寻求使数据科学家的某些角色和职责自动化。这导致了AutoML或自动化机器学习的出现。由于具有执行数据预处理,ETL(提取、转换、加载)任务和转换的能力,AutoML于去年开始流行。
AutoML是指利用机器学习算法解决实际问题的端到端流程的自动化过程。通过部署AutoML工具,收集数据并将其转化为可行的见解,对很多企业来说而言已经变得非常方便。这样做可以提高有效性,并使机器学习民主化,以便非专业人员可以轻松地将机器学习应用于他们的问题。使用AutoML还可以增强人工智能模型设置的超参数。通过反复试验和实验,它还可以帮助确定可用于所引入数据的最佳模型。
例如,谷歌公司的AutoML-Zero使用简单的数学概念作为构建块,以生成完整的机器学习算法。通过采用复杂的反复试验过程,AutoML-Zero(从一组100个算法中,每个算法具有独特的任务功能)确定性能最佳的算法,并保留以供将来迭代。此外,AutoML使数据存储自动化,识别泄漏点和配置错误,以确保结果的准确性和准确性,同时消除了普遍存在的偏差风险。除此之外,它还可以为企业提供新的机会,这些企业受时间和资源的限制,无法创建直到最近才可以访问的机器学习模型。
数据正以前所未有的速度增长。随着有关数据爆炸的报告增加了十倍,基于人工智能和基于机器学习的数据分析也将看到新一轮的数据需求激增。这意味着autoML将成为许多公司的有前途的资源。AutoML帮助中小型公司达到收集数据并从中获取见解所需的复杂分析水平,而无需寻找和雇用数十名机器学习专家。与人类同行相比,它也留出了最小的错误余地。从数据科学家处理模型的自助服务部署,模型生命周期管理,功能工程到插补和重新缩放以及模型训练,AutoML可以使数据科学家自由地专注于其他重要任务。
根据麦肯锡公司发布的一份报告,AutoML同样也会对招聘模式产生影响。例如,像药房研究中的生物化学家一样,AutoML的从业者将能够执行更简单的数据科学任务。它还将授权较少的人工智能技能人员构建和部署人工智能或基于机器学习的模型,并监控其性能。它将进一步更有效地最大化业务输出,并增加其准确性和周转时间。简而言之,AutoML将通过其强大的广泛功能帮助缩小人才缺口。尽管它肯定不会取代数据科学家,但它将高级机器学习的功能直接交给了业务用户。