百度昆仑+飞腾CPU+国产OS全国产化AI体系登场,不再遭受国外控制

4月15日讯,近日,百度昆仑AI芯片针对国产的飞腾CPU完成了适配,这是继百度飞桨(PaddlePaddle)深度学习平台之后,百度又一重量级 AI 产品与飞腾完成适配。


百度昆仑+飞腾CPU+国产OS全国产化AI体系登场,不再遭受国外控制_人工智能_人工智能


加上已经适配的国产 OS,在 AI 计算体系中有可能出现百度昆仑+飞腾 CPU+国产 OS+百度飞桨的全国产化体系,不再受到国外控制,这还是首次。


此前,百度智能芯片总经理欧阳剑在一次线上公开课中首次展示了百度昆仑 AI 芯片与飞腾 CPU 的适配视频片段。视频显示,搭载飞腾 CPU、昆仑加速卡的服务器,运行流畅,性能强劲,图像分割速度显著加速。


百度昆仑+飞腾CPU+国产OS全国产化AI体系登场,不再遭受国外控制_人工智能_人工智能


百度昆仑 AI 芯片是百度自研的云端全功能 AI 芯片,采用百度自研 XPU 神经处理器架构,提供 512GB/s 的内存带宽,能够在 150W 的功耗下提供高达 260 TOPS 的能力,是业内算力领先的国产 AI 芯片。


至于飞腾 CPU,与百度昆仑 AI 芯片完成适配的 飞腾 FT-2000+/64 处理器是飞腾面向高性能服务器领域的产品。该款处理器设计了数据亲和的多核处理器体系架构,突破了高效乱序超标量流水线、层次化片上并行存储结构、多级异构片上互连网络、高可用处理器设计等关键技术,实测性能达到了国际主流服务器 CPU 同等水平,填补了国产高端通用 CPU 领域的空白。


飞腾 FT-2000+/64 是中国首款自主设计的 64 核通用 CPU,也是国际上首款兼容 ARMv8 指令集的 64 核通用 CPU,为百度昆仑 AI 芯片提供了高效完整的 AI 计算流程支撑。


飞腾表示,当前正处于 AI + 智能云时代,从芯片架构、操作系统,再到上层应用,都有了革命性的变化。百度昆仑+飞腾 CPU+国产 OS,再加上国产深度学习平台百度飞桨(PaddlePaddle),以及新时代的各类应用,全国产的 AI 计算体系将登上历史舞台,并且有机会成为新的选择。


2018年的百度 AI 开发者大会上,百度创始人、董事长兼CEO李彦宏宣布推出自研AI芯片昆仑。百度研发AI芯片的积累得益于其用 FPGA 做AI加速的积累,也得益于其在软件定义加速器和XPU架构的多年积累。


百度最早在2010年开始用FPGA做AI架构的研发,2011年开展小规模部署上线,2017年部署超过了10000片FPGA,2018年发布自主研发AI芯片,2019年下半年流片成功,2020年开始量产。


百度昆仑+飞腾CPU+国产OS全国产化AI体系登场,不再遭受国外控制_人工智能_人工智能


昆仑芯片的定位是通用AI芯片,目标是提供高性能、低成本、高灵活性的AI芯片。欧阳剑在分享中说:“相比GPU,昆仑芯片的通用性和可编程性都做的不错,并且我们还在努力把编程性做的更好。”


昆仑发布之后,其相关消息陆续公布。架构方面,昆仑有2个计算单元,512GB/S的内存带宽,16MB S RAM /unit。欧阳剑介绍,16MB的SRAM对AI推理很有帮助,XPU架构上的XPU-SDNN是为 Te nsor等而设计,XPU-Cluster则能够满足通用处理的需求。


昆仑第一代芯片并没有采用NVLink,而是通过PCIE 4.0 接口 进行互联。在 三星 14nm的 制造 工艺和2.5D封装的支持下,昆仑芯片峰值性能可以达到260TOPS,功耗为150W。


在灵活性和易用性方面,昆仑面向开发者提供类似 英伟达 C++ UDA的软件栈,可以通过C/C++语言进行编程,降低开发者的开发难度。


目前,基于第一代昆仑芯片,百度推出了两款AI加速卡,K100和K200,前者算力和功耗都是后者的两倍。


他同时表示,昆仑已经在百度内部规模应用。至于对外提供AI算力,去年12月13日百度通过定向邀请的方式通过百度云提供昆仑的算力。在与欧阳剑的直播互动中,雷锋网(公众号:雷锋网)了解到通过百度云提供昆仑AI算力目前仍然是定向邀请的方式,且主要是私有部署的方式。百度会通过定向邀请的客户的反馈消息,再通过百度云大规模向外提供昆仑的算力,但他没有给出具体的时间线。


除了通过百度云提供昆仑的算力,欧阳剑也展示了昆仑加速卡在工业智能设备中的应用。欧阳剑演示的是用 CPU 和昆仑加速卡去进行产品缺陷检测,昆仑可以大幅提升速度,但并没有给出具体的对比数据。


另外一个展示则是昆仑的杀手锏,那就是和国产处理器平台飞腾的适配。在2019飞腾生态伙伴大会上,欧阳剑就透露昆仑AI芯片正在适配国产飞腾服务器,做性能调优工作。在今天的线上分享中,欧阳剑展示了采用昆仑加速卡带来的图像分割速度的显著加速。


飞腾CPU处理器采用的是 Arm v8指令级,主要用在数据中心和云计算中心,作为国产芯的代表,昆仑选择与飞腾进行很好地适配显然是看中了国产自研芯片的大市场。


通过飞腾CPU+昆仑AI加速器的方式,双方可以更好的实现国产芯片在服务器市场的国产化,也可以视为昆仑AI芯片和加速卡未来增长的一个重要动力和杀手锏。


77
34
0
61

相关资讯

  1. 1、《变形金刚外传》曝大黄蜂第二形态,这次变成吉普车了2747
  2. 2、《我是特种兵2》动“真格”打造最真实军旅戏2334
  3. 3、战场上,为何胆小的人也不敢装死?886
  4. 4、《向着胜利前进》热播于荣光吴奇隆大秀身材3436
  5. 5、古天乐三国新片五一上映,日本版权方点赞:游戏效果非常逼真4227
  6. 6、成龙李连杰退休,甄子丹吴京快打不动了,以后功夫片要消亡?2765
  7. 7、5部高分谍战剧,男主高颜值实力派,你最喜欢哪一部?2288
  8. 8、《诡拼车》发纪录片包小柏倪景阳参演内幕曝光3519
  9. 9、《功夫熊猫》:中国的故事,为什么一定得美国人来讲?2056
  10. 10、《骊歌行》人物关系有趣,女三是男主前任,他俩戏里戏外都是夫妻955
全部评论(0)
我也有话说
0
收藏
点赞
顶部