摩尔定律持续发挥作用的几十年间,无数应用受益于芯片性能的快速提升,芯片市场的格局也在这个过程中逐步稳定,x86 CPU在桌面和高性能计算市场占有绝对优势,ARM CPU统治移动互联网市场。
然而,随着摩尔定律的放缓,市场的格局也开始发生变化。能效比优势明显的ARM CPU经过三年多的努力,已经在x86 CPU统治的云计算、HPC市场取得了值得关注的成绩。并且,正在快速增长的DPU和5G市场,ARM也雄心勃勃。
三年推两代产品
2018年10,ARM推出了ARM Neoverse,这是面向云到边缘基础设施产品,ARM承诺Neoverse平台效能30%的年增长率将持续到2022年及以后。要知道,那时候摩尔定律给传统CPU带来的提升已经不足10%。
ARM Neoverse规划了三个系列产品,同时考虑性能、功率、面积(PPA),擅长可扩展的N系列;提供最佳性能,相对会消耗更多面积和功耗的V系列;主要关注效率,在功耗和面积的缩减上进行优化的E系列。
2019年,第一代Neoverse N1推出,性能相比Cosmos平台提升60%,是2018年提出的目标的两倍。同时推出的还有Neoverse E系列处理器。
2020年发布的Neoverse N2,在保持相同水平的功率和面积效率之余,相比Neoverse N1单线程性能提升了40%。强调性能的Neoverse V1的单线程性能相比Neoverse N1更是提升超过50%。
单核性能大幅提升的ARM Neoverse CPU今年接连交出成绩单。今年3月,安晟培半导体(Ampere Computing)发布 “首款云原生处理器”Ampere Altra,拥有80个64位ARM 处理器内核,雷锋网(公众号:雷锋网)此前的文章介绍过,这是Ampere在2020年流片的产品。不久后,甲骨文就发布了Ampere A1 Compute。
到了7月,基于网络基础设施提供CDN内容分发网络与减缓DDoS攻击的服务提供商Cloudflare首次采用基于ARM架构服务器进行部署。据悉,相较于2013年设计的服务器,Cloudflare基于ARM架构的系统可以安全地处理10倍以上的互联网请求。
在高性能计算领域,日本国立研究开发法人理化学研究所(RIKEN)与富士通公司共同基于ARM架构开发的超级计算机“富岳”连续第三次名列国际超级计算机500 大(TOP500)排行榜的第一名。
ARM为什么能够迅速拓展高性能计算市场?
ARM接连交出的漂亮成绩单背后,是市场需求的变化。
“面对未来基础设施的多样化要求,传统的通用解决方案已经不再适用。云服务提供商和超大型互联网公司正在推动的创新达到了一个前所未有的水平。这些都在驱动整个数据中心的优化逐渐从上层应用迁移到整机,并进一步扩展到服务器处理器。”ARM基础设施事业部全球高级总监邹挺进一步表示。
“通过Neoverse,ARM和广泛生态合作伙伴系统正在提供一个独特的平台,来实现未来针对服务器芯片的解决方案。其中,AWS Graviton2所带来的强劲发展势头就是这个共同愿景的非常有力的证明。”
性能的提升给有差异化需求的云计算提供商针对ARM高性能CPU进行优化的动力。目前,百度智能云数据库积极发展 ARM 平台数据库产品,已经完成ARM架构的全栈代码改造和性能优化,性能打平传统架构平台。
腾讯也持续在 ARM 架构上进行优化与实践工作,通过性能测试、数据交流、技术研讨等形式不断推动JDK在ARM架构的发展。据悉,KonaJDK团队目前完成了JDK8和JDK11等版本的优化,后续也计划支持JDK17等版本,未来也会加大投入完善JDK对ARM架构的支持。
“基础设施市场变化非常快速,也在不断发展,为了满足这个市场的多样性与快速变化,必然会出现不同类型的计算解决方案。”邹挺进一步表示。
“一方面,我们看到超大型互联网客户通过ARM IP定制服务器芯片,满足特殊应用场景需求。另一方面,也有大量企业客户对标准化ARM服务器芯片带来的高性价比、优异的TCO(总体拥有成本)表现有着很浓烈的兴趣,这也给独立的 ARM 服务器芯片厂商带来非常广阔的市场前景。”
邹挺认为,ARM在云领域上我们已经取得了最相对领先的成功。同时,在中国市场ARM重点关注的领域是云数据中心/超大型互联网领域、和5G网络/电信市场。
加大软件生态投入站稳高性能CPU市场
5G的蓬勃发展,也给ARM带来了新的机会。英伟达将在其5G平台上扩大对ARM架构的支持。
另外,在即将爆发的DPU市场,ARM Neoverse也被多款产品采用。两个月前,Marvell 发布了基于Neoverse N2平台的DPU。上月的英特尔架构日,英特尔透露了其首款IPU产品的信息,让人有些意外的是其款IPU集成了ARM Neoverse N1 CPU。
邹挺认为,DPU 连接到主机系统,并通过 PCI-Express 插槽供电,再加上DPU支持专用的工作负载加速器和数据包处理功能,所以DPU中的处理器能否提供出色的每瓦性能至关重要。Neoverse N系列能够提供行业领先的每瓦性能表现,是DPU核心的最佳选择。
有业内人士也告诉雷锋网,ARM能够提供更加成熟的软件工具链也是其在高性能CPU和DPU市场被采用的重要原因。
ARM当然也看到了这一点,并且正在加强其在高性能CPU软件生态方面的建设。据了解,在ARMv8时代的十年,ARM软件开发人员所投入的研发时间超过了 1,000 万个人时。在ARMv9时代的十年,ARM软件开发人员的投入时间大概率会超过3,000万个人时。
具体到基础设施领域,邹挺介绍,“通过过去十年的努力,ARM现在拥有大量的OSS项目,ISV也已经支持ARM 64位架构。在Docker Hub上为ARM编写的容器镜像数量超过10万。同时,在ARM硬件上进行CI/CD构建的时间已经多达每个月超过100万分钟。”
企业级云原生软件的支持上,ARM的合作伙伴红帽近期也宣布其Openshift on ARM开发者预览版也在中国落地。
ARM在云计算、HPC、5G所需的高性能CPU市场的软件生态正在成熟,高性能计算CPU的市场也正在迎来新的变化。