Arm 发布新一代Cortex移动CPU架构
近日,Arm发布了全新一代Cortex移动CPU架构,包括Corte-X4超大核、大核A720及能效核A520,都是基于最新的Armv9.2指令集,相比上代的X2/X3基于Armv9.0主要提升了性能及并行性,可以支持更多的大核/超大核组合。这一次Arm不仅全面走向纯64位,淘汰32位架构,同时也做到了更高的性能,PC上有望实现10核X4+4核A720的搭配。
除了X4、A720等CPU架构之外,Arm这次也升级了DynamIQ 管理内核DSU-120,可以更好地提升CPU并行性,最高做到了14核CPU。
同时它还从之前的1+3+4架构变成了1+5+2架构,给A720这样的大核留出了更多空间。
这次新架构的另一个重大变化就是新架构只有AArch64位,AArch32已经被放弃了,意味着此后的Arm将转向纯64位架构。
来看下性能/能效的变化,X4超大核心提升了15%的性能或者40%的功耗降低,A720大核也有20%的能效提升,A520小核的能效提升了22%。
作为单核性能的主力,X4超大核是Arm架构中能效最好的,同时还提升了并行性,L2缓存可提升到每核2MB。
大核A720升级到了Armv9.2指令集,同样的功耗下性能比上代的A715更强,架构优化了内存读取,带来了大幅功耗降低,同样的面积下性能比A78还要高。
A520小核这次最大的变化主要是放弃32位,转向纯64位,主打低功耗,而且面积减少22%的情况下性能还能提升8%。
整个X4/A720/A520家族的特点就是性能提升同时能效更高,X4超大核能降低40%功耗让人很期待,其他核心及DSU也有20%左右的能耗改善。
通过与台积电的深度合作,Cortex-X4 CPU已经在台积电N3E工艺上完成流片!
台积电3nm工艺家族依旧成员众多,而且在不断调整升级,目前包括N3(N3B)、N3E、N3P、N3X、N3S等等。
N3是最初版本,又称N3B,号称对比N5同等功耗性能提升12%、同等性能功耗降低27%,但性能、功耗、量产良率和进度等都未达预期,于是有了增强版的N3E。
N3E修复了N3B上的各种缺陷,设计指标也有所放宽,对比N5同等功耗性能提升15-20%、同等性能功耗降低30-35%,逻辑密度约1.6倍、芯片密度约1.3倍。
N3E工艺预计最快2023年年中量产,Arm、AMD、NVIDIA、博通、高通、联发科、美满电子等都会采纳。
N3P将是N3E的后续升级版,继续优化性能和工艺,性能提升5%,功耗降低5-10%,芯片面积提升4%。
N3X面向高性能,对比N3P性能再提升5%,芯片密度不变。
N3S被视为终极版,深入优化集成密度。
3nm也台积电最后一次使用FinFET晶体管架构,有望和当年极为成功的28nm以上获得非常强的生命力,尤其是N3E。
另外根据路线图,Arm明年将按期推进带来下一代平台TCS24,包括超大核心Blackhawk、大核心Chaberton、能效核心Hayes、高端GPU Krake,等等。
Arm还发布了新一代GPU——G720系列,相比之前的G710/G715还在使用第四代图形架构,G720这波升级到了第五代GPU架构,不再挤牙膏升级了。
而且从这一代开始,Arm的GPU架构命名不再采用什么Valhall、Bifrost之类的代号,改用XX代来称呼。
此前的Arm GPU架构使用的还是基于贴图(tile)的渲染技术,在G720使用的第五代GPU架构使用了全新的DVS(Deferred Vertex Shading,延迟顶点着色)技术。
DVS技术的好处就是顶点着色的过程中,在执行阶段才会载入内存中,不像之前那样需要两次载入内存,因此大幅降低了对带宽的要求。
在手机等移动平台的图形渲染中,内存带宽会消耗1/3的功耗,因此DVS技术可以大幅降低游戏功耗,提升续航,同时也提高了能效。
根据Arm公布的数据,在《精灵废墟》游戏中带宽节省了41%,《原神》中节省了33%带宽,《堡垒之夜》中为26%,甚至在CAD的应用中也可以节省37%的带宽。
不过DVS技术对性能的提升似乎不算夸张,峰值性能提升了15%,每瓦性能提升了15%左右。
总的来说,G720的DVS架构更多地是降低了带宽需求,节省了功耗,跟CPU一样都更看重能效提升,这样倒是更符合日常使用,发热会更低,手机续航更好。
另外在画质方面,Arm提及的不多,但受益于带宽节省,动态照明、景深及光追等技术也会更好,同时虚幻5引擎年底也会进入手机平台。
G720系列GPU这次会分为三个级别,最高端的叫做Immortalis G720,核心可以更多,至少10个以上,多的可达16核。
往下就是Mali-G720,GPU核心数在6到9个之间,再往下就是Mali-G620,GPU核心数在5个及以下。
来源网络,如有侵权联系即删