去年 10 月,华为 2018 全联接大会里,华为公布昇腾 910 芯片(Ascend 910)芯片,号称是全球已经发布的单芯片计算密度最大的 AI 芯片——当然,从宣布到商用也需要一个过程,华为当时表示会在 2019 年第二季度商用。
2019 年 8 月 23 日,伴随着一场专门的发布会,昇腾 910 的商用终于到来。
全球算力最强 AI 处理器,即将商用
在发布会上,华为徐直军表示,去年昇腾 910 宣布之后,华为内部已经进行了测试。结果显示,在算力方面,昇腾 910 完全达到了设计规格,也就是:半精度 (FP16) 算力达到256 Tera-FLOPS,整数精度 (INT8) 算力达到 512 Tera-OPS。更重要的是,昇腾 910 达到规格算力所需的功耗仅为 310W,明显低于设计规格的 350W。
由此,徐直军表示:
昇腾 910 总体技术表现超出预期,作为算力最强 AI 处理器,当之无愧。我们已经把昇腾 910 用于实际 AI 训练任务。
针对未来的计划,徐直军表示,针对不同的场景,包括边缘计算、自动驾驶车载计算、训练等场景,华为将持续投资并推出更多的 AI 处理器,面向全场景持续提供更充裕、更经济、更适配的AI 算力。雷锋网(公众号:雷锋网)注意到,在发布会上,徐直军已经公布了部分 AI 芯片的名称,比如说昇腾 610、昇腾 620,还有昇腾 920。
雷锋网了解到,早在 2018 年 10 月,华为就已经宣布了昇腾 910 的不少关键信息。昇腾 910是一款服务器芯片,具体参数为:
半精度为(FP 16):256 TeraFLOPS;
整数精度(INT8):512 TeraOPS;
128 通道 全高清 视频解码器- H.264/265;
最大功耗 350 W;
采用 7nm 工艺。
当时,徐直军还表示,华为昇腾 910 芯片将不会对外单独销售,而是以 AI 加速卡、加速模块、服务器和一体机等模式对外销售。
另外,在前不久举行的 Hot Chips 大会上,华为介绍了旗下的 AI 芯片所采用的达芬奇(Da Vinci)架构,其中就包括昇腾 910 芯片。
据雷锋网了解,华为的达芬奇核心分为三种,最完整的是 Max,其次是 Lite,再次是 Tiny,Max 可在一个周期内完成 8192 次 MAC 运算,Tiny 为 512次。就具体芯片来说,昇腾 910 属于 Ascend-Max 系列,它基于 7nm 增强版 EUV 工艺,单 Die 内建 32 颗达芬奇核心,半精度高达 256TFOPs,功耗为 350W。
值得一提的是,在 HotChips 大会上,华为还将昇腾 910 的计算密度与 NVIDIA Tesla V100 和 Google TPU v3 进行了对比,其中昇腾 910 的计算密度远远超过了这两个竞争对手。
MindSpore 框架发布,明年 Q1 开源
除了昇腾 910 AI 处理器,华为还发布了 MindSpore 计算框架,这是与 TensorFlow、PyTorch、PaddlePaddle 等框架竞标的一款产品。
去年华为全联接大会上,华为提出,AI 框架应该是开发态友好(例如显著减少训练时间和成本)和运行态高效(例如最少资源和最高能效比),更重要的是,要能适应每个场景包括端、边缘和云。经过近一年的努力,全场景 AI 计算框架 MindSpore 在这三个方面都取得了显著进展。
全场景支持,是在隐私保护日渐重要的背景下,实现 AI 无所不在越来越基础的需求,也是 MindSpore 的重要特色。针对不同的运行环境,MindSpore 框架架构上支持可大可小,适应全场景独立部署。MindSpore 框架通过协同经过处理后的、不带有隐私信息的梯度、模型信息,而不是数据本身,以此实现在保证用户隐私数据保护的前提下跨场景协同。
除了隐私保护,MindSpore 还将模型保护 Built-in 到 AI 框架中,实现模型的安全可信。 在原生适应每个场景包括端,边缘和云,并能够按需协同的基础上,通过实现 AI 算法即代码,使开发态变得更加友好,显著减少模型开发时间。
以一个 NLP(自然语言处理)典型网络为例,相比其他框架,用 MindSpore 可降低核心代码量 20%,开发门槛大大降低,效率整体提升 50% 以上。通过 MindSpore 框架自身的技术创新及其与昇腾处理器协同优化,有效克服 AI 计算的复杂性和算力的多样性挑战,实现了运行态的高效,大大提高了计算性能。除了昇腾处理器,MindSpore 同时也支持 GPU、CPU 等其它处理器。
为了更好促进 AI 的应用,徐直军宣布 “MindSpore 将在 2020 年 Q1 开源”,助力每一位开发者,促进 AI 产业生态发展。
总结
正如雷锋网所报道的那样,华为在 2018 全联接大会上全面发布了 AI 战略和华为的全栈全场景 AI 解决方案;其中全场景包括公有云、私有云、各种边缘计算、物联网行业终端以及消费类终端等部署环境,全栈是技术功能视角,是指包括芯片、芯片使能、训练和推理框架和应用使能在内的全堆栈方案。
在这次的发布会上,徐直军表示,伴随着今天昇腾 910 AI 处理器以及 MindSpore 全场景 AI 计算框架的发布,华为全栈全场景 AI 解决方案各重要组成部分悉数登场,由此华为也已完成了全栈全场景 AI 解决方案的构建。
另外,徐直军还表示,在今年 9 月 18 日的华为全联接大会上,华为将会发布更多的重磅 AI 产品。