研究表明,数据分析到云平台的迁移正在进行中,并且使内部部署数据仓库过时了。
根据调研机构Global Market Insights的估计,到2025年,云计算提供商将托管大部分数据仓库负载。但是不要相信。Gartner公司估计,现在有30%的数据仓库工作负载在云中运行,到2024年,这一数字将增长到三分之二。而在2016年,这一数字还不到7%。
这些都不是令人惊讶的。甚至核心数据仓库技术提供商都已经看到了这一趋势,并花费了大部分研发预算来为公共云提供商构建解决方案。此外,公共云提供商本身也拥有“公司杀手”产品,例如AWS公司的RedShift,这是一种旨在与大型企业数据仓库参与者竞争的列式数据库。
过去在公共云上构建数据仓库和数据集市的障碍包括人们认为安全仍然是公共云上的问题。此外,考虑到必须使用便携式存储系统物理迁移数PB的数据,因此很难从本地系统中迁移它们。最后,在许多情况下,那些在内部部署运行数据仓库的人员无法找到可在本地利用的分析工具,也不想更改。
事实是所有这些块都已删除。在人们建立和维护数据仓库之前,大多数人就被删除了,因为他们意识到公共云远远领先于大多数本地工具。如今,云计算具有更好的安全性、性能、成本和分析能力。
内部部署数据仓库的真正杀手在于云平台上人工智能的兴起以及将人工智能与传统数据分析相集成的能力。人工智能不是新事物,但是能够与数据在公共云上并置的数据智能几乎为零。考虑到数据仓库也是培训数据的源泉,人工智能可以改变游戏规则,它可能跨越数十年,并提供尚无法实现的业务见解。
将许多内部部署数据仓库推向云端的另一个趋势是,越来越需要直接利用交易数据进行分析。数据仓库以仅捕获事务数据快照并将其汇总到数据仓库中进行分析而闻名。这意味着该信息可能存在数周甚至数月之久。越来越多的高管要求提供实时仪表板,以考虑交易系统中的当前数据,例如销售订单输入。
这意味着人们需要使用具有数据抽象层的过渡数据来模拟分析数据库,并将其与人工智能系统绑定在一起,以使解决方案更具吸引力。可以通过本机服务或其生态系统和市场从公共云提供商中找到该技术也就不足为奇了。
因此,内部部署数据仓库几乎已死。它可以通过基于云的数据分析和数据库技术来生存,而廉价的人工智能和以更创新的方式(例如使用交易数据)处理数据的能力可以轻松地增强它的生存能力。
迁移到云平台有很多作用。首先,它允许企业最终在一个可集中访问的平台上整合数据。其次,数据通常在云中更安全。最后,那些需要利用数据的人员不再局限于本地技术的局限性。